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OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence: 

Scoring table: 



May 13, 2004, 09:24:53 ; Search time 7717 Seconds 

(without alignments) 
12162.347 Million cell updates/sec 

US-10-015-391A-276 
3143 

1 gggctgaggcactgagagac aaatataaggcttaaaaaaa 3143 

IDENTTTY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



27513289 seqs, 14931090276 residues 



Total number of hits satisfying chosen parameters: 



55026578 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database : 



EST: ' 
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em_estba : * 
em_esthum: * 
em_estin : * 
em_estmu : * 
em__estov: * 
em__estpl : * 
em_estro : * 
em_htc: * 
gb_estl : * 
gb_est2 :* 
gb_htc: * 
gb_est3:* 
gb_est4 : * 
gb_est5:* 
em_estfun: * 
em_es torn: * 
em_gss_hum: * 
em_gss_inv: * 
em__gss_pln: * 
em_gss__vrt : * 
em_gss_fun: * 
em_gss_mam: * 
em_gss_mus : * 
em_gss_pro : * 
erti_gss_rod: * 
em__gss__phg : * 
em_gss__vrl : * 



28: gb_gssl:* 
29: gb_gss2:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
AY402621 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 
ORIGIN 



GI:39758607 



(human) 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



AY402621 2172 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM1285 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY402621 
AY402621. 
GSS. 

Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2172) 

Clark, A. G., Glanowski , S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 
Clark, A. G. , 



to 2172) 

Glanowski, S . , Nielson, R. , Thomas, P . 



Kejariwal, A. , 

Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/ Qualifiers 

1. .2172 

/organism="Homo sapiens" 
/mol_type=" genomic DNA 11 
/db_xref= ,, taxon:9606 M 
<1. .>2172 

/locus_tag="HCMl2 85" 



Query Match 59.6%; Score 1874; DB 29; Length 2172; 

Best Local Similarity 86.3%; Pred. No. 0; 

Matches 1874; Conservative 0; Mismatches 298; Indels 0; Gaps 0; 

Qy 105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I f I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I 
Db 1 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 60 

Qy 165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

I I I I I I I I I I I 1 1 I I I I I I I I 1 I I I I I I I I I I I I I 1 I I 1 1 1 II I I I I I I I ! I I I I I I I I I 
Db 61 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 12 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



225 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 284 

I I I I I I II I I i I I II I I I I I I I I I I i I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I ! I 
121 AGGGT CAGATACT AT G CAG GGGAT GAAC GT AGG GCACT T AGCTT CT T C C ACC AGAAGGG C 180 

285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I II I I I I I I I I I I I I M I I II I I I I I I I I I I 

181 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 240 

345 C GAGAAGC CAT TCTGGCCTTG GAT AT C C AGGAT C C AGGG GT C C C C AGGCT AAAGAAC AT G 404 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 C GAGAAGC CAT T CT GGC CT T GGAT AT C CAGGAT C CAGG G GT C CC CAGGCT AAAGAACAT G 30 0 

405 AT AC C GT GG CC AGC CAGT GACAGAAAAAAGAGT GAAT GT GC CTT TAAGAAGAAGAGC AAT 4 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I 

301 AT AC C GT G G CCAGC CAGT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAG C AAT 360 

4 65 GAGAC AC AGT GT T T CAACT T CAT CCGTGTCCTGGTTTCT T AC AAT GT CAC C C AT CT CT AC 524 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 i 1 1 1 1 II I 1 1 II I 1 1 1 1 1 

361 GAGACACAGT GT T T CAACT T CAT CC GT GT C CT GGTT T CT TACAAT GT CAC C C AT CT CT AC 42 0 

525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

421 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 48 0 

585 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 64 4 

I I I I I I I I II I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 540 

64 5 GCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAAC 704 

I I I I I I I I ! I I I I I I I I I I I I I I I II I I I I I I I I 1 1 I I I I I I I I I I I I i I 1 I I I I I I I I I 

541 GCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAAC 600 

705 TTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACC 764 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 TTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACC 660 

765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I I I I I I I I I I I I I I I I II I I I I I I 

661 GACAACTT C CT CC GCT GGCTGCAT CNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 720 

825 C AGGT C GT C T AC TTCTTCTTC GAGGAGACAGC C AGC GAGT T T GACT T CT T T GAGAGGC T C 884 

721 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 78 0 

885 CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 944 

781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 84 0 

945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


961 


NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 


1020 


yy 






1184 






1 I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 




Db 


1021 


TTCTCT CT CTT GGACAT T GAAC GT GT CTTTAAGGGGAAAT ACAAAGAGTT GAACAAAGAA 


1080 




1 1 8 S 

J_ J. O ~J 


ArTTrArGfTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 


1244 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 II 




Db 


1081 


ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 


1140 


Piw 

Qy 




PTGr^rrrrTfrTrTGAT AAPrPTPPPTPtAPPTTPATGAAPTpTAPPATTTcrTGATGGATGAG 


1304 




I | || | || | | || 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1141 


GTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAG 


1200 


Qy 




rAArTr^Tr^GGArGrrrrTGrTGGTGAAATrTGGCCTGGAGTATArArGGrTTGCAGTG 


1364 




1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


1201 


CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 


1260 


Qy 


1 Q £ R 


rarar , arrrrflrrrrr ,| T r rr , a r rrrrrzira^r , raTrTTCTrz\TGTArrTGGGAArrArrArA 


1424 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


GAGACAGC CC AG GGC CT T GAT GGGC AC AGC C AT CTT GT CAT GT AC CT GGGAAC CAC C ACA 


1320 


Qy 


i /toe 


rrrTrrrTrrArAA^^rTGTGGTAAGTGGGGArAGrAGTGrTrATGTGGTGGAAGAGATT 


1484 




1 I 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


GGGTCGCTCCACAAGGCT GT GGTAAGT GGGGACAGCAGT GCTCATCTGGT GGAAGAGATT 


1380 


Qy 




rz\rrTrT f T i rrrTrAr , rrTGAArrTnTTrGrAArrTGrAGrTGGfrrrrAr'GrAGGGTGrA 


1544 




1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 


1440 


Qy 




p m p t 1 t t 1 p t 1 a p p p t t pt p a pp a ppt PT P T P,P A PPPTPPPPPPAPPP A APT P/F A PTPTPT 1 AT 


1604 




1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 i 1 M 1 1 1 1 1 




Db 


1441 


GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 


1500 


Qy 


lDU J 


PAPAPPTPTPTPPAPTPTPTPPTTPPPPPPPrAPPPPnAPTPrTPTrf'TGGGAf'CCTGAGTCC 


1664 




I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 


1560 


Qy 


1 ODD 


pp a APPTPTTPPPTPPTPTPTPPPPPP A APPTPA APTCrTGGAAGC AGG AC AT GGAGCGG 


1724 




I | | | | | | | | | | | | || 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 




Db 


1561 


CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 


1620 


Qy 


1 79 R 


PPPAAPPPAPAPTPPPPATPTPPPAPTPPCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 


1784 




1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1621 


GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 


1680 


Pnr 

wy 


1 7 R S 


C GC C C G CAAAT C AT T AAAGAAGT C CT GGCT GT CC C CAACT C CAT C CT GGAG CT C C C CT GC 


1844 




1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 M 1 




Db 


1681 


CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 


1740 


Qy 


1845 


C CC CAC CT GT C AGCCT T G GC CT CT T AT TAT T GGAGT CAT GG C C C AG CAGC AGT C C CAGAA 


1904 




1 I I 1 1 1 II 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


1741 


CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 


1800 


Qy 


1905 


GCCTCTTCCACTGTCTAC7\ATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 


1964 



I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1! I I I I I I I I I I I I M I I I I I I I 



Db 



1801 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1860 



Qy 1965 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I M I I I I I I I t 1 I I I I I I I I I I I I I I I I I I I I I I ! I I I I 1 1 I M I I I I I I I I I I I I I I I I 

Db 1861 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 1920 

Qy 2025 GACAGC C AGGAC CAGAC C CT GG C C CT GGAT CC T GAACT GGCAG GCAT C C C C C GGGAG CAT 2084 

I I I I I I I I I I I 1 I I I I I I I I I t I I I I I I I I I I I I I I I I I M ! I I I I I I I I I I I I I I I I I I 

Db 1921 GACAGC C AGGAC CAGAC C CT GG CC CT GGAT C C T GAACT GGCAG GCAT C C CC CGGGAGC AT 1980 

Qy 2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 214 4 

I I I I It I I I II I I I I I I I I I I I i I I I I I I I I I I M t I I I I I I I I I I I I I I I I I I I I I I II 

Db 1981 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 204 0 

Qy 2145 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2 041 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2100 

Qy 2205 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2264 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 2101 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2160 

Qy 2265 ACCCTGCGCCCT 2276 

I I II I I I I I I I I 
Db 2161 ACCCTGCGCCCT 2172 
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AY402622 
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DEFINITION 

ACCESSION 
VERSION 
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REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Pan. 



AY402622 2133 bp DNA linear GSS 12-DEC-2003 

Pan troglodytes HCM1285 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY402622 

AY4 02622. 1 GI: 39758 608 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2133) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2133) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 



them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2133 

/organism="Pan troglodytes" 
/mol_type="genomic DNA" 
/db_xref="taxon: 9598" 
gene <1. .>2133 

/locus_tag="HCM12 85" 

ORIGIN 

Query Match 56.2%; Score 1765.4; DB 29; Length 2133; 

Best Local Similarity 82.9%; Pred. No. 0; 

Matches 17 69; Conservative 0; Mismatches 364; Indels 0; Gaps 0; 
Qy 105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

II I I I I I ! I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCTyV 60 

Qy 165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

I I I I I I I I I I I I I I I ! 1 I I I 11 I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
Db 61 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGANNCGGGCAGGGGCCCATGCCC 120 

Qy 225 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 2 84 

I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AGGGT CAGATACTAT GCAGGGGAT GAACGTAGGGCACTTAGCTT CTT CCACCAGAAGGGC 18 0 

Qy 285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 24 0 

Qy 345 CGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATG 4 04 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 C GAGAAGC CATT CT GGC CT T GGAT AT C CAGGAT C C AGGGGT C C C CAGG CT AAAGAAC AT G 300 

Qy 405 AT AC C GT GGC CAGC C AGT GAC AGAAAAAAGAGT GAAT GT G C CTT T AAGAAGAAGAGC AAT 4 64 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3 01 AT AC C GT GGC CAGC CAGT GAC AGAAAAAAGAGT GAAT GT GC CT T TAAGAAGAAGAGC AAT 360 

Qy 465 GAGAC AC AGT GT TT CAACT T C AT CC GT GT C CT GGT TT CT T ACAAT GT CAC C CAT CT CTAC 524 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGACACAGT GTTT CAACTT CATC CGT GT CCT GGTTT CTT ACAAT GT CAC CCAT CTCTAC 420 

Qy 525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 421 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 4 80 

Qy 585 CT GT T GC C C AT CT C GGAGGACAAG GT CAT GGAGG GAAAAGGC CAAAGC C CCTT T GAC CC C 644 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 540 

Qy 645 GCT CACAAGC AT ACGGC T GT CT T GGT G GAT GGGAT GCT CT AT T CT GGT ACT AT GAAC AAC 704 

I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 541 GCTCACAAGCATACGGCTGTCTTGGTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 600 

Qy 705 TTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACC 764 

I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 601 NTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACC 660 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I I I I I I I I I I I M I I I I I I I I II I 

661 GACAACT T C CT CCGCT GGCT GCAT CNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 72 0 

825 CAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTC 884 

721 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 7 8 0 

885 CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 944 

781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 84 0 

945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1020 

1125 TT CT CT CT CTT GGACATT GAACGT GT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAA 1184 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M 

1021 TT CT CT CT CTT GGACATT GAACGT GT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAA 1080 

1185 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 1244 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1081 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 1140 

1245 GT GGGC C CCT C CT CT GAT AAGG C C CT GAC CT T CAT GAAGGAC C ATTT C CT GAT GGAT GAG 1304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 GT GGGC C C CT C CT CT GAT AAGGC C T T GAC CT T CAT GAAGGAC CATTT C CT GAT GGAT GAG 1200 

1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

I I IMM I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I 

1201 CAGGTGGTAGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 12 60 

1365 GAGACAGCC CAGGGC CTT GAT GGGCACAGCCATCTT GT CAT GT ACCT GGGAACCACCACA 1424 

I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 

1261 GAGACAGC C CAGG GC CT T GAT GGGC ACAGC CAT CTT GT CAT GT AC CT GGGAAC CAC C AC A 1320 

1425 GGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATT 1484 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I M 

1321 GGGTCGNTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGANNNNNTT 1380 

1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

I I I I I I I I I I II I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1440 

1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I 

1441 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1500 



Qy 


1605 


Db 


1501 


Qy 


1665 


Db 


1561 


Qy 


1725 


Db 


1621 


Qy 


1785 


Db 


1681 


Qy 


1845 


Db 


1741 


Qy 


1905 


Db 


1801 


Qy 


1965 


Db 


1861 


Qy 


2025 


Db 


1921 


Qy 


2085 


Db 


1981 


Qy 


2145 


Db 


2041 


Qy 


2205 


Db 


2101 



GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1664 

I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I 

GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGATCCTGAGTCC 1560 

CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

| | M I! I I I I I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I I I 11 I 

CGAACCTGTTGCCTCCTNNNNNNNNNNNNNNNGAACTCCTGGAAGCAGGACATGGAGCGG 1620 

GG GAAC C C AGAGT G G GC AT GT GC C AGT G GC C C CAT GAGC AG GAGC CTTCGGCCT C AGAG C 1784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I 

GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 168 0 

CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGNTCCCCTGC 174 0 

C CCCAC CT GT CAGC CT T GGC CT CT TAT TAT T GGAGT CAT GGCC CAGC AGCAGT C C CAGAA 1904 

I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

CCCCACCTGTCAGCCTTGGCCTCTTACTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1800 

GCCTCTTCCACTGTCTAC7\ATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I II II I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I 

GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1860 

CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I 

CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 192 0 

GACAGCCAGGAC CAGAC C CT GGC C CT GGAT CCT GAACT GGCAGGC AT C C C C C G GGAGC AT 2 084 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

GAC AGC C AGGAC CAGAC C C T GGC C CT GGAT CCT GAACT GG CAG G CAT C C C C C GGGAGC AT 198 0 

GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I II I I I I 

GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2 04 0 

TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I | | | I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2100 

ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGG 2237 

I I I II I I I I I I I I I I I I I I II I I I I I I I I I 

ATCCTCNTGGCCTCCCCANNGAGAGCACTCCGG 2133 



RESULT 3 
AK077976 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



AK077976 3206 bp mRNA linear HTC 18-SEP-2003 

Mus musculus 13 days embryo male testis cDNA, RIKEN full-length 
enriched library, clone : 6030492A12 product : sema domain, 
immunoglobulin domain (Ig) , transmembrane domain (TM) and short 
cytoplasmic domain, (semaphorin) 4A, full insert sequence. 
AK077976 

AK077976. 1 GI : 26097602 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus . 

1 

Carninci,P. and Hayashizaki , Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu^. and Hayashizaki, Y . 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Konno,H., Akiyama,J., Nishi,K. f Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura, S. , Hazama,M., Nishine,T., Harada,A., 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M. , 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu, M. , Inoue,Y., Kira,A. and Hayashizaki , Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3206) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M. , Hanagaki,T., Hara,A. , Hashizume, W . , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi , F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu, M. and Hayashizaki, Y . 
Direct Submission 

Submitted ( 16-APR-2002 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 



COMMENT 



FEATURES 

source 



misc feature 



polyA_signal 
polyAjsite 
ORIGIN 



RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc . riken. go . jp, 
URL thttp: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222 , 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details . 
URL : http : //genome . gsc . riken . go . jp/ 
URL: http://fantom.gsc. riken. go. jp/ . 

Location/Qualifiers 

1. .3206 

/organism="Mus musculus" 
/mol__type="mRNA" 
/strain="C57BL/6J" 
/db_xref="FANTOM_DB: 60304 92A12" 
/db_xref="MGI: 2394968" 
/db_xref="taxon: 10090" 
/clone="6030492A12" 
/sex="male" 
/tissue__type=" testis" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="13 days embryo" 
224. .2507 
/note= "putative 

sema domain, immunoglobulin domain (Ig) , transmembrane 
domain (TM) and short cytoplasmic domain, (semaphorin) 4A 
(MGD |MGI : 107560, GB | NMJ313658 , evidence: BLASTN, 99%, 
match=2517)" 
3181. .3186 
/not e= "putative " 
3206 

/note="putative " 



Query Match 55.6%; Score 1747.4; DB 11; 

Best Local Similarity 76.7%; Pred. No. 0; 
Matches 2355; Conservative 0; Mismatches 621; 



Length 32 06; 
Indels 95; Gaps 



14; 



Qy 

Db 



75 GAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCC 134 
III I I I I I I I I III I I II I I I I I I I I I I I I I I I I I M I I II I I I I I 
194 GAAC CAT CT GGT GAC CAT CT C AGG CT GAC CAT GG C CCT AC C AT CC CT GG GC C AGGACT C A 253 



QY 



Db 



135 TGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACC 194 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II III i I 

254 TGGAGTCTCCTGCGTGTTTTTTTCTTCCAACTCTTCCTGCTGCCATCACTGCCACCTGCT 313 



Qy 

Db 

Qy 

Db 



195 GC GGGGGGAGGCGGGCAGGGGCCC AT GCCCAGGGTCAGAT ACT AT GCAGGGGAT GAAC GT 254 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

314 TCTGGGACTGGTGGTCAGGGGCCCATGCCCAGAGTCAAATACCATGCTGGAGACGGGCAC 373 

255 AGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGT 314 

I I I I I II I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
374 AGGGCCCTCAGCTTCTTCCAACAAAAAGGCCTCCGAGACTTTGACACGCTGCTCCTGAGT 433 



Qy 


315 


Db 


434 


Qy 


375 


Db 


494 


Qy 


435 


Db 


554 


Qy 


495 


Db 


614 


Qy 


555 


Db 


674 


Qy 


615 


Db 


734 


Qy 


675 


Db 


794 


Qy 


735 


Db 


854 


Qy 


795 


Db 


914 


Qy 


855 


Db 


974 



G GT GAT GGAAAT ACT CT CT ACGT GGGGGCTC GAGAAGC CAT TCTGGCCTT GGAT AT C C AG 374 

I I I I I I I I! I I I I I I I I I I I I II I I i I I I I I M I I I I I I I I 

GAC GAT G G CAACACT CT C TAT GT GGGGGCTC GAG AG GC C GTCCTGGCCTT GAAT AT CC AG 4 93 

GAT CCAGGGGT C C CCAGGCTAAAGAACAT GATACC GT GGCCAGCCAGT GACAGAAAAAAG 434 

| | | | | | | I I I | | I M I I I I I I I I I I I 1 I M I I I I I I I I I I I I I I I I I I I I 1 I I 
AACCCAGGAATCCCAAGGCTAAAGAACATGATACCCTGGCCAGCCAGTGAGAGAAAAAAG 553 

AGT GAAT GT GC CT T TAAGAAGAAGAGCAAT GAGACACAGT GT T T CAACT T CAT C C GT GT C 4 94 

I I I I I | I I I I I 1 I I I I I I I I i I I I I I! I I I I 1 I ! I I I I I I I I I I I I I I I I I II III 

AC C GAAT GT GC CT T TAAGAAGAAGAGCAAT GAGACACAGT GT T T CAACT T CATT CGAGT C 613 

CTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCT 554 

I I I I I I I I I I I I I I I II II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

CTGGTCTCTTACAATGCTACTCACCTCTATGCCTGTGGGACCTTTGCCTTCAGCCCTGCC 673 

TGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATG 614 

I | I I I I | | I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T GT AC CT T CAT T GAACT C CAAGAT T C C CT CC T GT T GC C CAT CT T GAT AGACAAG GT CAT G 733 

GAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGAT 67 4 

M || || I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I! Ill 
GACGG GAAGGG C CAAAGC CC CT T T GAC CCT GT T C ACAAGC ACACAGCT GT CT T GGT C GAT 793 

GGGAT GCT CT ATT CT GGT ACTAT GAACAACT T CCT GGGCAGT GAG CC CAT CCT GAT GC G C 734 

I | | I I I I I I II II II II I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGATGCTTTATTCCGGCACCATGAACAACTTCCTGGGCAGCGAGCCCATCCTGATGCGG 853 

ACACT GGGAT C CCAGC CT GT CCT CAAGACC GACAACTT CCT C C GCT GGCT GCAT CAT GAC 7 94 

I 1 I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I II I I I I I I I I I I I I II 
ACACTGGGATCCCAGCCTGTTCTCAAGACTGACATCTTCTTACGCTGGCTGCACGCGGAT 913 

GCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACA 854 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

GC CT C CT T C GT GGC AGC C AT T C C AT CCAC C C AGGT CGT CT AT TTCTTCTTT GAGGAGACA 973 

GCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAG 914 

I I M I I I I I I I I I I I I I I I I I I I III I I II I I I I I I I I I I I I I I I I I I I 
GCCAGCGAGTTTGACTTCTTTGAAGAGCTGTATATATCCAGGGTGGCTCAAGTCTGCAAG 1033 



Qy 

Db 


915 
1034 


AATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAG 

1 I III Ill 1 II 1 1 II M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 

AACGACGTGGGCGGTGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTCAAAGCCCAG 


974 
1093 


Qy 


975 


CTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTGCTCTGCGCTCAGCCAGGGCAGCTGCCATTCAACATCATCCGCCACGCGGTCCTGCTG 


1034 


Db 


1094 


1153 


Qy 


1035 


CCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTT 

I i i I I 1 1 1 1 1 1 I I 1 1 1 1 1 III 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCCGCCGATTCTCCCTCTGTTTCCCGCATCTACGCAGTCTTTACCTCCCAGTGGCAGGTT 


1094 


Db 


1154 


1213 


Qy 


1095 


GGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTT 

1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGCGGGACCAGGAGCTCAGCAGTCTGTGCCTTCTCTCTCACGGACATTGAGCGAGTCTTT 


1154 


Db 


1214 


1273 



Qy 1155 AAGG GGAAAT ACAAAGAGT T GAACAAAGAAACTT CACGCT GGACT ACTT ATAGGGGCCCT 1214 





1 974 


Qy 


X<£ 10 


ud 


X O J *± 


Qy 


1Z / J 


nk 
UD 


1 ^ Q4 


Qy 


1 qqi: 


JJD 


14 Jfi 


Qy 




JJD 


1 M 4 


Qy 


14oo 


nk 
JJD 


1 R74 


Qy 


1 C 1 /» 

1514 


JJD 


1 £^4 


Qy 


Xj / 4 


nk 
JJD 


1 £Q4 


Qy 


loo4 


nk 

JJD 


1 7 R4 

X 1 Ofi 


Qy 


1 by 4 


nk 

JJD 


1 Q1 / 
X O ± *± 


Qy 


1/04 


JJD 


X O / J. 


Qy 


1 o 14 


UD 


J_ _? o X 


Qy 


1 £74 
X O / 4 


Db 


1991 


Qy 


1934 


Db 


2051 


Qy 


1994 



11 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 II II II 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 I 

AAAGGGAAGTACAAGGAGCTGAACAAGGAGACCTCCCGCTGGACCACTTACCGGGGCTCA 



1333 



GAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACC 1274 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGGTCAGCCCGAGGCAAGGCAGTTGCTCCATGGGCCCCTCCTCTGACAAAGCCTTGACC 1393 

TTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAA 1334 

I I I I I I I I I I I I I I I I I i II I I I I I I I I I II I I I I I I I II I II II I I I I I I I I I 
T T CAT GAAG G AC CAT T T T C T GAT G GAT GAG C AC GT G GT AG G AAC AC CCCTGCTGGT G AAG 1453 

T CT GGC GT GGAGTAT ACAC GGCTT GCAGT GGAGACAG CC CAGGGC CT T GAT G GG C AC AGC 1394 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

TCTGGTGTGGAGTACACACGGCTTGCTGTGGAGTCAGCTCGGGGCCTTGATGGGAGCAGC 1513 

CATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGG 1454 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 
CATGTGGTCATGTATCTGGGTACCTCCACGGGGTCCCTGCACAAGGCTGTGGTGCCTCAG 1573 

GACAGCAGTGCT CATCTGGT GGAAGAGATT CAGCT G-TT CCCT GACCCT GAAC CTGTT CG 1513 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I II I I I I I I I I 
GAC AG CAGT GCT T AT CT C GT G GAGGAGAT T CAGCT GAGC C C CT GACT CT GAGC CT GT T CG 1633 

CAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTG 1573 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I 

AAACCTGCAGCTGGCCCCCGCCCAGGGTGCAGTGTTTGCAGGCTTCTCTGGAGGCATCTG 1693 



GAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCG 

III I II I I I II I I I I I 1 I I III I I I I I I I I I I I I I I I I 1 I I 

GAGAGT T C CC AGGGC CAAT T GCAGT GT C T AC GAGAGCT GT GT GGAC T GT GT G CT T GC C AG 



1633 



1753 



1693 



GGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAA 

I I I I I I I II I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I 
GGACCCTCACTGTGCCTGGGACCCTGAATCAAGACTCTGCAGCCTTCTGTCTGGCTCTAC 1813 

CCT GAACT CCT GGAAGCAGGAC AT GGAGC GGGGGAAC C C AGAGT G GG CAT GT GC CAGT GG 1753 

I II I I I I I I I I I I II II I I I I I I II I I I I I I I I I I II I I I MINI 

C AAGC CT T GGAAGC AG GAC AT G GAAC GC GGCAAC C C GGAGT GGGT AT G C ACC C GT GG 187 0 

CCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGC 1813 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I III I I I II I I I I I I I I I I I I 
CCCCATGGCCAGGAGCCCCCGGCGTCAGAGCCCCCCTCAACTAATTAAAGAAGTCCTGAC 1930 

TGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTA 1873 

I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 
AGTCCCCAACTCCATCCTGGAGCTGCCCTGCCCCCACCTGTCAGCACTGGCCTCTTACCA 1990 

T T GGAGT CAT G GC C CAGC AGC AGT C C C AGAAG C CT CT T C C ACT GT CT AC AAT GGCTCCCT 1933 

I I I I I I I I I I I I I III I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

CTGGAGTCATGGCCGAGCCAAAATCTCAGAAGCCTCTGCTACCGTCTACAATGGCTCCCT 2050 

CTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGG 1993 

II I I I I I I I I I I I I I I I II II II I I I I I I I I I I I III I II I I I I I M 

CTTGCTGCTGCCGCAGGATGGTGTCGGAGGCCTCTACCAGTGTGTGGCGACTGAGAACGG 2110 

CTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGA 2053 
II I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I iiits 



Db 


2111 


CTACTCATACCCTGTGGTCTCCTATTGGGTAGACAGCCAGGACCAGCCCCTGGCGCTGGA 


2170 


Qy 


2054 


T C CT GAACT GG C AGGCAT C C C C C GGGAGC AT GT GAAGGT C C C GT T GAC C AGG GT C AGT G G 

I I I I I Mill III 1 Mill 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I 1 1 i II 
I 1 I I I Mill III 1 Mill 1 II 1 MM l l l l l l I I i i i i i i i i i t i t ii 

CCCTGAGCTGGCGGGCGTTCCCCGTGAGCGTGTGCAGGTCCCGCTGACCAGGGTCGGAGG 


2113 


Db 


2171 


2230 


Qy 


2114 


TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCT 
II M II II M 1 11 M 1 II II M 1 M II 1 M M 1 Ml IIS II II Mill 

|| M II 1 M I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 I 1 1 1 1 M 1 1 Ml 111 II II 1 1 ! f 1 

CGGAGCTTCCATGGCTGCCCAGCGGTCCTACTGGCCCCATTTTCTCATCGTTACCGTCCT 


2173 


Db 


2231 


2290 


Qy 


2174 


CTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACT 

I I III 1 Mill 1 I 1 1 MM II II 1 1 11 M II 1 1 II 1 II II 
| | |M 1 11 1 1 1 II II MM 1 1 1 1 1 I ii ) i i i i i it i ii ii 

CCTGGCCATCGTGCTCCTGGGAGTGCTCACTCTCCTCCTCGCTTCCCCACTGGGGGCGCT 


2233 


Db 


2291 


2350 


Qy 


2234 


CCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTT 
i t i i i I i I I I I I I I l II i II I II 1 II 1 t 1 1 1 If III MM II II 1 II 1 

1 M II 1 M II 1 1 1 M 1 II II II II II ! i 1 MM IM MM Mill 11 ! 

GCGGGCTCGGGGTAAGGTTCAGGGCTGTGGGATGCTGCCCCCCAGGGAAAAGGCTCCACT 


2293 


Db 


2351 


2410 


Qy 


2294 


AAGC AG AG AGCAAC AC CT C CAGT CT CC CAAGGAAT GC AGGACCT CT GC C AGT GAT GT GGA 

Mill M II 1 1 1 M II l l 1 1 1 1 M M 1 1 1 II M II 1 II 1 II II 1 M II 
Mill II II M 1 M 11 II ! 1 1 M 1 1 I 1 II II M I II M 1 1 M M it M 

GAGCAGGGACCAGC ACCT C C AGC C CTCCAAG GAC CACAGGAC CT CT GC CAGT GAC GT AGA 


2353 


Db 


2411 


2470 


Qy 


2354 


CGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCT- 
ii ii m i it ii II ill 1 II II 1 M 1 1 I 1 1 1 M 1 M 

II 1 M 1 1 1 I 1 1 II III 1 M M 1 1 1 1 1 1 1 1 Ml III 

T GCC GACAACAAC CAT CTGGGCGCC GAAGT GG CT TAAACAGGGACAC AGAT C C GCAGCT G 


2412 


Db 


2471 


2530 


Qy 


2413 


-GCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATG 

M 1 III i I 1 1 1 1 1 1 II Mill II 
II 1 II 1 M 1 1 1 II 1 II Mill II 


2471 


Db 


2531 


2563 


Qy 


2472 


ACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACT 

Ml t II II 1 1 MM II M II II II II II 
Ml 1 II M 1 1 MM I 1 1 II II 1 M ii I i 

CAGGCACAGT GCCACT CT GAC CAGGGT AGGAGGCT CT CCTGCTAACGT GT GTCACC 


2531 


Db 


2564 


2619 


Qy 


2532 


GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GC CT CCCCT AT GGGACT CCCTT CTAC C 
i I I I I I l i ll II 1 1 II II M II 1 M 1 M II 1 1 

j 1 M II 1 II 1 II 1 M 1 M i M l M M M M 1 1 

TACAGCACCCAGTAGG TCCTCCCCTGTGGGACTCTCTTCTGCA 


2591 


Db 


2620 


2662 


Qy 


2592 


AAGC ACAT GAGCT C T CTAAC AG GGT GG GGGCT AC CC CC AGACCT GCT C CTAC ACT GAT AT 

l 1 1 1 M II 1 E 1 1 II II 1 1 1 1 1 1 1 
1 1 1 II 1 II 1 ii i ii i 1 i 11 111 1 

AGCACATTGGGCTGTCT CCATACCTGTACTTGTGCTGTGAC 


2651 


Db 


2663 


2703 


Qy 


2652 


T GAAGAAC CT GGAGAGGAT CCT T CAGTT CT GGCCATT CCAGGGACCCT CCAGAAACACAG 
II II M 1 1 1 1 M 1 II II II 1 1 1 1 II 1 1 1 1 1 1 1 1 

|| || M 1 II 1 1 II MM 1 11 1 M M 1 1 1 1 I I i i 

AG GAAGAGC C AGAC AGGT T T CT T T GAT T T T GAT T GAC C CAAGAGC C CT CCT GT AACAAAC 


2711 


Db 


2704 


2763 


Qy 


2712 


T GT T T CAAGAGAC C CT AAAAAAC CTGCCTGTCC C AGGAC C CT AT G GT AAT GAAC AC C AAA 

II 1 1 II III 1 1 M 1 1 1 1 1 1 1 I 1 1 1 1 1 
MM II II 1 1 mi ii ii ii i i i i i i • 

GT GCT CC AG GAGAC CAT GAAAGGT GT GGCT GT CT GGGAT T CT GT GGT GACAAAC - CT AAG 


2771 


Db 


2764 


2822 


Qy 


2772 


CAT CT AAACAAT CAT AT GCT A ACAT GCCACT CCTGGAAACTCCACTCT G 

I I 1 1 1 II 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 1 

CATCCGAGCAAGCTGGGGCTATTCCTGCAAACTCCATCCTGAACGCTGTCACTCTAGAAG 


2820 


Db 


2823 


2882 


Qy 


2821 


AAGCTGCCGCTTTGGACACCAACACTCCCTTC-TCCCAGGGTCATGCAGGGATCTGCTCC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II M 
CAGCTGCTGCTTTGAACACCAGCCCACCCTCCTTCCCAAGAGTCTCTATGGAGTTGGCCC 


2879 


Db 


2883 


2942 



Qy 2880 CTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTG 2939 

II II MM I I I I M III I II I I I I I I I M I II I II 

Db 2943 CTTGTGTTTCCTTTACCAGTCATGCCATACTGTTT GGGAAGT CAT CT CT GAAGT CT A 2999 

Qy 2940 ACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT TCTGCCCTGGC-AG 2995 

II II II I I I M M I I I I II I II I II M I I I I M I II II I II I I II II 

Db 3000 ACCACCTTCCTTCTTGCTTCAGTTTGGACAGATTGTTATTATTGTCTCTGCCCTGGCTAG 3059 

Qy 2996 AATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCT 3055 

I M I I II I I I I I II I I II I I II I II I I I I I II I I II I I I 
Db 3060 AATGGGGGGCATAATCTGAGCCTTGTTCCCTTGTCCAGTGTGGCTGACCCTTGACCTCTT 3119 

Qy 3056 CCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTT 3115 

II III I I II M I II I I II I I I I I I I I I I I I M M II I I I I I I I I I I II I I 

Db 3120 — CCTTCCTCCTCCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCACAGACAATTTATTT 3177 

Qy 3116 TTTATTAAAAA 3126 

I I I II I M I I I 
Db 3178 TTTATTAAAAA 318 8 
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AK035918 3086 bp mRNA linear HTC 19-SEP-2003 

Mus musculus 16 days neonate cerebellum cDNA, RIKEN full-length 
enriched library, clone : 9630018D15 product : sema domain, 
immunoglobulin domain (Ig) , transmembrane domain (TM) and short 
cytoplasmic domain, (semaphorin) 4A, full insert sequence. 
AK035918 

AK035918 . 1 GI: 26084904 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y . 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M. , 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M. , Nishine,T., Harada,A. , 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi , K . , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 



Okazaki,Y., Muramatsu,M. , Inoue,Y w Kira,A. and Hayashizaki, Y . 
TITLE RI KEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 
JOURNAL Genome Res. 10 (11), 1757-1771 (2000) 
MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 3086) 

AUTHORS Adachi,J., Aizawa,K., Akimura, T . , Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A. , Hashizume,W. , 
Hayashida,K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura,K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H. , Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A. , Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi , A. , 
Muramatsu,M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted (16- JUL-2 001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc . riken . go . jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222 , 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL:http: //fantom. gsc. riken. go. jp/ . 
FEATURES Location/Qualifiers 
source 1. .3086 

/organism="Mus musculus" 

/mol_type="mRNA M 

/strain="C57BL/6J" 

/db_xref="FANTOMJDB:9630018D15" 

/db_xref="MGI : 2400269" 

/db__xref="taxon: 10090" 

/clone="9630018Dl5" 

/tissue__type=" cerebellum" 

/clone lib= "RIKEN full-length enriched mouse cDNA library" 



misc feature 



polyA_signal 
polyA_site 
ORIGIN 



/dev_stage="16 days neonate" 

59. .2388 

/note="putative 

sema domain, immunoglobulin domain (Ig), transmembrane 
domain (TM) and short cytoplasmic domain, (semaphorin) 
(MGD | MGI : 1 0 7 5 6 0 , GB | NM_013658, evidence: BLASTN, 99%, 
match=2517) " 
3062. .3067 
/note="putative " 
3086 

/note= "putative 11 



4A 



Query Match 54.1%; Score 1701.4; DB 11; Length 3086; 

Best Local Similarity 75.2%; Pred. No. 0; 

Matches 2364; Conservative 0; Mismatches 637; Indels 141; Gaps 14; 



Qy 


oU 


IN III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 

AAC C CAGAAAGT GC CT GT TT C C T CAGAAC CAT CT GGTGAC CAT CT C AG GC T GAC CAT G GC 


109 


Do 


A 

4 


63 


Qy 


I 1 A 

II u 


X ^ V-*-r\Lj LL-V/ X uoovvy X uun^^^v^' X uurtuL <^ X v^-v^ J. kjkjkj^k^ x x x x \^s^ x \^ ± ± v_.\^.ttjt.\^ x vj^ x 
I | | 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCTACCATCCCTGGGCCAGGACTCATGGAGTCTCCTGCGTGTTTTTTTCTTCCAACTCTT 


169 


Db 




123 


Qy 


1 / u 


tp arrTrrTrrTr^rrr^zxrr;arf^ArrnrnnaGGGAGGrGGGCAGGGGCCCATGCCCAGGGT 

| | | | | | Ml I 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 t 1 1 1 1 

CCTGCTGCCATCACTGCCACCTGCTTCTGGGACTGGTGGTCAGGGGCCCATGCCCAGAGT 


229 


DO 


1 9 A 


183 


Qy 


o o pi 


raraTarTaTrrarrrrATraarnTAn^rArTTA^rTTrTTrrArCAGAAGGGCCTCCA 

\^J-\\jJ\x X J\x uL-ziouOvj/ii vj/Turt.^ w x riuuuL.A^ X xs^J^X J.UJL X v> \^r\\^- vnunnu w ^ x \. 
| | | | I I I I M 1 1 II 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CAAATACCATGCTGGAGACGGGCACAGGGCCCTCAGCTTCTTCCAACAAAAAGGCCTCCG 


289 


DD 


i p/i 
10 4 


243 


Qy 


290 


GGAT TT T GAC ACT CT GCT C CT GAGT GGT GAT GGAAAT ACT CT CT ACGT GGGGGCT C GAGA 
II 1 II 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 
AGACTTT GAC AC GCT GCT CCT GAGT GACGAT GGCAACACT CT CTAT GT GGGGGCT C GAGA 


349 


Db 


244 


303 


Qy 


350 


AG C CAT T CT GGCCT T GGAT AT C C AGGAT C CAGGGGT C C C C AGGCTAAAGAAC AT GAT AC C 

Ml 1 MINIMI II 1 1 II M 1 1 1 1 1 1 MM 1 1 1 1 1 1 II II 1 II II 1 1 1 1 1 

GGCC GT CCT GG C CT T GAAT AT C CAGAAC C CAGGAAT CC CAAGGCTAAAGAAC AT GAT AC C 


409 


Db 


304 


363 


Qy 


410 


GT GGCCAGCCAGT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAATGAGAC 

II II 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 II II II 1 1 1 1 1 1 1 1 II 1 M 1 1 1 1 1 II 1 1 M 1 1 1 1 

CT GGC CAGCCAGT GAGAGAAAAAAGACCGAAT GT GC CTTTAAGAAGAAGAGCAAT GAGAC 


469 


Db 


364 


423 


Qy 


470 


ACAGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTG 

II 1 I 1 1 II 1 1 M 1 1 1 1 1 1 II II 1 1 M II 1 1 II II 1 1 1 1 M II M M 1 1 1 1 1 

ACAGT GT T T CAACT T CAT TC GAGT CCTGGTCTCTTACAATGCTACTCACCTC TAT GCCTG 


529 


Db 


424 


483 


Qy 


530 


CGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATT 

II Mill M 1 1 II 1 1 1 1 1 M 1 1 II 1 1 1 M M II 

TGGGACCTTTGCCTTCAGCCCTGCCTGTACCTTCATTACGTGCGACCCTGGCATTCTGGG 


566 


Db 


484 


543 


Qy 


567 


GAACTTCAAGATTCCTACCTGTTGCCCATCTCGGAG 

Mill 1 1 1 1 M 1 M II M II II II 1 1 II 1 
CTCCCAGCCTCTTCCCCCCTCTAGGAACTCCAAGATTCCCTCCTGTTGCCCATCTTGATA 


602 


Db 


544 


603 



Qy 


603 


Db 


604 


Qy 


663 


Db 


664 


Qy 


723 


Db 


724 


Qy 


783 


Db 


784 


Qy 


843 


Db 


844 


Qy 


903 


Db 


904 


Qy 


963 


Db 


964 


Qy 


1023 


Db 


1024 


Qy 


1083 


Db 


1084 


Qy 


1143 


Db 


1144 


Qy 


1203 


Db 


1204 


Qy 


1263 


Db 


1264 


Qy 


1323 


Db 


1324 


Qy 


1383 


Db 


1384 


Qy 


1443 



GACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACi\AGCATACGGCT 662 

| I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I II III 

GACAAGGT CAT G GAC GGGAAGG G C CAAAGC C CCTT T GAC CCT GTT C ACAAGC AC ACAGCT 663 

GT CT T G GT GGAT GGGAT GCT CT AT T CT GGT ACT AT GAACAACT T C CT GG G CAGT GAGC C C 722 

| | M M M I I I I I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 

GT CT T GGT C GAT GGGAT GCT T TAT T C C G GC AC CAT GAACAACT T C C T GG G C AGC GAGC C C 723 

ATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGG 782 

| I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I 1 I I I II I I I I I I I I 
AT CCT GAT GC GGACACT G G GAT C C CAGC C T GTT CT CAAGACT GAC AT CT T C T T ACG CT GG 783 

CTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTC 842 

I M I I II I I I I I I I I I I I I I I I I I I I M M I I I I I II I I I I I I I MINI 
CTGCACGCGGATGCCTCCTTCGTGGCAGCCATTCCATCCACCCAGGTCGTCTATTTCTTC 843 

TTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCT 902 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I III I I I I I I I I 

T TT GAGGAGACAGC CAGC GAGT T T GACT T CT T T GAAGAG CT GTAT AT AT C C AG GGT GGCT 903 

AGAGT CT GCAAGAAT GAC GT GGGC GGC GAAAAG CT GCT G CAGAAGAAGT GGACCAC CT T C 9 62 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 

CAAGT CT GCAAGAACGAC GT GGGC GGT GAAAAG CT GCT GCAGAAGAAGT GGAC C AC CT T C 963 

CTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCAC 1022 

II || I I I I I I I I I I I I I I I Mill II I II I I I I I I I I I II I I I I I I I I I I I I 

CTCAAAGCCCAGTTGCTCTGCGCTCAGCCAGGGCAGCTGCCATTCAACATCATCCGCCAC 1023 

GCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCC 1082 

I I I I I I I II I I I II I I I I I I I I I I I I I I I III I II I I I I I I 1 I I I I I I I I I I I 

GCGGTCCTGCTGCCCGCCGATTCTCCCTCTGTTTCCCGCATCTACGCAGTCTTTACCTCC 108 3 



CAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATT 

I | I I I I I I I I I I I I I I I I I I I I II I I II I II II I I I I I I I I I I I I I I I I I I I I I I 
CAGTGGCAGGTTGGCGGGACCAGGAGCTCAGCAGTCTGTGCCTTCTCTCTCACGGACATT 



1142 



1143 



1202 



GAACGT GT CTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTT CACGCT GGACTACT 

M II I I I I I I I I I I I I I I I I I I III I I I! I I I II II II I I I I I I I I III 

GAGC GAGT CT TT AAAG G GAAGT ACAAGGAGCT GAACAAG GAGACCT C C C GCT GGAC CACT 1203 

TATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGAT 12 62 

|| I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
TACCGGGGCTCAGAGGTCAGCCCGAGGCCAGGCAGTTGCTCCATGGGCCCCTCCTCTGAC 1263 



I I I I II I I I I I M I I I I I I I II I I I I I I II I I I I I I I I I I I I II II Ml 



CTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTT 1382 

I I I II I II I II II I I I II I I II I I I II I II II II I I II I I I I I I I I I I M M I 
CTGCTGGTGAAGTCTGGTGTGGAGTACACACGGCTTGCTGTGGAGTCAGCTCGGGGCCTT 1383 

GAT GGGCACAGCCAT CTT GT CAT GTACCT GGGAACCACCACAGGGT C GCT CCACAAGGCT 1442 

MUM I M II I I I II I I I II I Mill III MM Mill M I I I II I I II 

GATGGGAGCAGCCATGTGGTCATGTATCTGGGTACCTCCACGGGGTCCCTGCACAAGGCT 1443 



1443 GT GGT AAGT GGG GAC AGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCT GT T CC CT GAC C CT 1502 



nK 

UD 


1AAA 


Qy 


i c n o 
loUo 


UD 




Qy 


lOOO 


UD 


lO D<i 


Qy 


■t coo 
lozo 


UD 


1 £9 /I 
1 DZ fl 


Qy 


loco 


UD 




Qy 


1743 


UD 


1 / fi 1 


Qy 


1803 


JJD 


1 OA1 

1 o U 1 


Qy 


i o a o 
lo DO 


UD 


1 Q £ 1 
1 O Dl 


Qy 


i9zo 


•PkK 

DD 


iyz i 


Qy 


1 o o o 
19 DJ 


UD 


1 QOI 


Qy 


Z U4o 


nK 
JJD 


Z U fi i. 


Qy 


z lUo 


nK 
UD 


91 m 

Z JL U X 


Qy 


Z 1 DO 


Db 


2161 


Qy 


2223 


Db 


2221 


Qy 


2283 



1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 

GTGGTGCCT C AG GACAGC AGT GCT T AT CT C GT G GAG GAGAT T C AGCT GAG C C CT GACT CT 



1503 



GAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCA 1562 

II I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I 

GAGCCTGTTCGAAACCTGCAGCTGGCCCCCGCCCAGGGTGCAGTGTTTGCAGGCTTCTCT 1563 

GGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGT 1622 

I I I I I I I I I I I I II Ml I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I 
GGAGGC AT CT GGAGAGTT CCCAGGGCCAATT GCAGT GT CT ACGAGAGCT GT GT GGACT GT 1623 

GTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTG 1682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II III I I I I I I I 

GTGCTGCNCAGGGACCCTCACTGTGCCTGGGACCCTGAATCAAGACTCTGCAGCCTTCTG 1683 



I I I I I I I 



II I I I I I II I I I II I I I I I I I I II I I I I I M I I II I I 



TGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAA 18 02 

|| I I I I I I I I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I 

TGCACCCGTGGCCCCATGGCCAGGAGCCCCCGGCGTCAGAGCCCCCCTCAACTAATTAAA 18 00 

GAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTG 1862 

I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGTCCTGACAGTCCCCAACTCCATCCTGGAGCTGCCCTGCCCCCACCTGTCAGCACTG 18 60 

GCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTAC 1922 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

GCCTCTTACCACTGGAGTCATGGCCGAGCCAAAATCTCAGAAGCCTCTGCTACCGTCTAC 1920 

AATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCA 1982 

I M I I II I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I II I I I I I 

AATGGCTCCCTCTTGCTGCTGCCGCAGGATGGTGTCGGGGGCCTCTACCAGTGTGTGGCG 1980 



ACT GAGAAT GGCTT T T CAT AC C CT GT GAT CT C CT ACT GG GT GGACAGC CAGGAC CAGAC C 

I I I I I I I I I I I I I II I I I I I I II I I I I I II I I I I I I I I I I II I I I I I I I I I II 

ACTGAGAACGGCTACTCATACCCTGTGGTCTCCTATTGGGTAGACAGCCAGGACCAGCCC 



2042 



2040 



2102 



CTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACC 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I 
CTGGCGCTGGACCCTGAGCTGGCGGGCGTTCCCCGTGAGCGTGTGCAGGTCCCGCTGACC 2100 

AGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACT 2162 

I I I I I I I II II II M I I I I I I I I I I II I I I I I I I I I I I I I Ml 

AGGGTCGGAGGCGGAGCTTCCATGGCTGCCCAGCGGTCCTACTGGCCCCATTTTCTCATC 2160 



II I I 



I I 



I I I I I I I I I I 



I I I I 



I I 



II I I I I II I I I I I I 



TTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAG 

II I II II I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

CTGGGGGCGCTGCGGGCTCGGGGTAAGGTTCAGGGCTGTGGGATGCTGCCCCCCAGGGAA 



I I I M I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 



2282 



2280 



2342 



Db 2281 AAGGCTCCACTGAGCAGGGACCAGCACCTCCAGCCCTCCAAGGACCACAGGACCTCTGCC 2340 

Qy 2343 AGT GAT GT GGAC GCT GACAACAACT GC CT AGGC ACT GAGGT AGCTT AAACT CT AGGC AC A 2402 

| | | I I || | | I I I II I I I I I I M I M I II II I M I II I I 
Db 2341 AGT GACGTAGAT GCCGACAACAAC CAT CT GGGCGCCGAAGT GGCTTAAAC AGGGACACAG 24 00 

Qy 2403 GGCCGGGGCT — GCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I M Ml I I I I I I I I I I I I I I I I I I I I I M 
Db 2401 ATCCGCAGCTGAGCAGAGCAAGCCACTGGCCTTGTTGGCTATGC 2444 

Qy 2461 T GACT AGGAT GACAGCAGCACAAAAGACCACCTTT CT CC CCT GAGAGGAGCTT CT GCT AC 252 0 

Ml I II II I I MM I I I M M I 

Db 2445 CAGGCACAGT GC CACT CT GAC CAGGGTAGGAGGCT CT CCT GCT AA 2489 

Qy 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GCCT CC CCTAT GGGAC 2580 

|| MM I II M M M II M I M I 

Db 2490 C GT GT GT CAC CT ACAGC AC C CAGT AGGT CCTCCCCTGTGGGAC 2532 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

I I I I II I I I M M I M I I I I II II I I 

Db 2533 T CT CTT CT GCAAGCACATT GGGCT GT CT C CAT ACCT GT ACT 2573 

Qy 2641 TACACT GATATT GAAGAACCTGGAGAGGAT CCTT CAGTT CT GGCCATTCCAGGGACCCTC 2700 

| || | | II II I I I I ! I II I MM M I I I I I I I 

D b 257 4 T GT GCT GTGACAGGAAGAGCCAGACAGGTTT CTTT GATT TT GATTGAC CCAAGAGC C CTC 2633 

Qy 2701 CAGAAAC AC AGT GT T T CAAGAGAC C CT AAAAAAC CT GC CT GT C C C AGGAC C CT AT GGT AA 2760 

| | MM I M II II Ml I Ml II I I I I I 

Db 2 634 CT GT AACAAACGT GCT C CAGGAGAC CAT GAAAGGT GTGGCT GT CT GGGAT T CT GT GGT GA 2693 

Qy 27 61 T GAACAC CAAACAT CTAAACAAT CAT AT GCT A ACATGCCACTCCTGGAAACTC 2813 

I I I I II M II I I II I I I M II I M I 

Db 2694 CAAAC - CT AAGC AT C C GAGCAAGCT GGG GCT ATT C CT GCAAAC T CC AT CCT GAAC GCT GT 2752 

Qy 2814 CACTCT GAAGCTGCCGCTTTGGACACCAACACTCCCTTC-TCCCAGGGTCATGCAG 2868 

I | I M I I II M I I II II M I M II I I I II I I I M M I I I I 

Db 2753 CACTCTAGAAGCAGCTGCTGCTTTGAACACCAGCCCACCCTCCTTCCCAAGAGTCTCTAT 2812 

Qy 2869 GGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTT 2928 

II I M II II I I I M I II II I M I I II I Ml I I I II II I I 

Db 2813 GGAGTTGGCCCCTTGTGTTTCCTTTACCAGTCATGCCATACTGTTT GGGAAGT CAT C 2869 

Qy 2929 CCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT TCT 2985 

|| | M II II M M M I I II M I I M II I II M II MM I I M I Ml 

Db 287 0 TCTGAAGTCTAACCACCTTCCTTCTTGCTTCAGTTTGGACAGATTGTTATTATTGTCTCT 2929 

Qy 2986 GCCCTGGC-AGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACC 3044 

|| | M I II M I II II II II I M M II II II I I I M I I I I I M I M 

Db 2930 GCCCTGGCTAGAATGGGGGGCATAATCTGAGCCTTGTTCCCTTGTCCAGTGTGGCTGACC 2989 

Qy 3045 CCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAG 3104 

|| | | Mill I I I M II II I II II M I II II I M I M M I I M I I 

Db 2990 CTTGACCTCTT — CCTTCCTCCTCCCTTTGTTTGGGGATTCAGAAAACTGCTTGTCACAG 3047 

Qy 3105 ACTGTTTATTTTTTATTAAAAA 3126 

II II II I II II I M M M M 
Db 3048 AC AAT T TAT T T T T TAT T AAAAA 3069 
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Query Match 43.7%; 
Best Local Similarity 71.9%; 
Matches 1560; Conservative 



Score 1372.2; 
Pred. No. 0; 
0; Mismatches 



DB 29; Length 2172; 
611; Indels 0; Gaps 



0; 



Qy 

Db 

QY 
Db 



105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I till I I II I I I I 
1 ATGGCCCTACCATCCCTGGGCCAGGACTCATGGAGTCTCCTGCGTGTTTTTTTCTTCCAA 60 



165 



61 



CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 

|| I I I I I I I III I I I M I I I I I I I I I I I I I I I I I I I I 

CTCTTCCTGCTGCCATCACTGCCACCTGCTTCTGGGACTGGTGGTCAGGGGCCCATGCCC 



224 



120 



Qy 

Db 



225 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 284 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I 
121 AGAGT CAAATACCATGCT GGAGACGGGCACAGGGCCCT CAGCT TCTT CCAACAAAAAGGC 180 



Qy 

Db 



285 
181 



344 
240 





O T. -J 


C GAGAAGC C AT TCTGGCCTT GGAT AT C C AGGAT C C AGGGGT CC C C AG GCT AAAGAAC AT G 

I I M 1 M 1 1 i i 1 1 1 M II 1 1 1 1 1 1 1 1 1 INN 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

q GAGAGGCCGTCCTGGC CTT GAATAT CCAGAACC CAGGAAT CCCAAGGCTAAAGAACAT G 


404 


Db 


241 


300 


qy 


*± .J 


AT AC C GT GGC C AG C C AGT GAC AGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGC AAT 
| I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 
AT ACCCT GGC CAGCCAGT GAGAGAAAAAAGACCGAAT GT GCCTTTAAGAAGAAGAGCAAT 


464 






360 


QY 


4 6^ 

O J 


r^AaArArAGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTAC 

I | | | | I I I M 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 1 1 1 

GAGAC ACAGT GT T T CAACT T C ATT C GAGT CC T GGT CT CT T ACAAT G CT ACT C AC C T CT AT 


524 


UiJ 


O U ± 


420 


QY 


S9 S 

J6 J 


ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCCTGTGGGACCTTTGCCTTCAGCCCTGCCTGTACCTTCATTGAACTCCAAGATTCCCTC 


584 


n"K 
UD 


491 

^. -L 


480 


uy 


JO J 


TT (TTT GC C C AT C T C G GAGGACAAGGT C AT GGAGGGAAAAGGC CAAAGC C C CT T T GAC C CC 

t | M 1 1 1 I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 

CTGTTGCCCATCTTGATAGACAAGGTCATGGACGGGAAGGGCCAAAGCCCCTTTGACCCT 


644 


UD 


4 P 1 
ft 0 -L 


540 


Qy 


£4 R 

O 3 


r:rTrArAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAAC 

1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 

GTT C ACAAGCAC AC AGCT GT CT T GGT C GAT GG GAT GCT TT ATT CC G GC AC CAT GAAC AAC 


704 


UD 


S4 1 


600 


Qy 


/ u o 


TTrrTf^^GrAGTGAGCrCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACC 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

TTCCTGGGCAGCGAGCCCATCCTGATGCGGACACTGGGATCCCAGCCTGTTCTCAAGACT 


764 


UD 




660 


QY 


/ U J 


GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GACATCTTCTTACGCTGGCTGCACGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


824 


nK 

UD 


661 

U V -L 


720 


QY 


825 


CAGGT C GT CT ACT TCT T CT T CGAGGAGACAGC CAGC GAGTT T GACT T CT T T GAGAGGC T C 


884 


nH 

DiJ 


721 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


780 


QY 


885 


CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 


944 


nh 

UiJ 


781 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


840 


Qy 


945 


AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 


1UU4 


Db 


841 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


900 


Qy 


1005 


TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 


1064 


Db 


901 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


960 


Qy 


1065 


TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 

1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 M 1 II II 1 1 1 1 1 1 

NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCAGCAGTCTGTGCC 


1124 


Db 


961 


1020 



1125 TTCTCTCTCTT GGAC AT T GAAC GT GT CT T T AAG GGGAAAT ACAAAGAGT T GAACAAAGAA 1184 

| M I I I I I I I I I I I I I M II I I I I I I I I I I I I I Mill III II II I I I II 
1021 T T CT CT CT C AC GGAC ATT GAGC GAGT CT T TAAAGG GAAGT ACAAG GAGC T GAAC AAG GAG 108 0 

1185 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 124 4 

| | | | | | | | | | | I I I I I I I I II I I I I I Mill M I II II I II I I II I I 

1081 ACCTCCCGCTGGACCACTTACCGGGGCTCAGAGGTCAGCCCGAGGCCAGGCAGTTGCTCC 1140 

1245 GTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAG 1304 

I | || | || || | | | | || | II III II II I I I M I II I I I I M M I I I II II I II M I I 
1141 AT GGGCCCCT C CT CT GACAAAGC CT T GAC CT T CAT GAAG GACC AT TTT CT GAT G GAT GAG 1200 

1305 CAAGT GGT GG GGAC GC C C CT GCT GGT GAAAT CT GGC GT GGAGT AT ACAC GGCTT GCAGT G 1364 

I | ! I I I I I M I II II I II I I I I MM I I II I I II I I I III 

1201 CACGTGGTAGGAACACCCCTGCTGGTGAAGTCTGGTGTGGAGTACACACGGCTTGCTGTG 1260 

1365 GAGACAGCCCAGGGCCTT GATGGGCACAGCCAT CTTGTCATGTACCT GGGAACCACCACA 1424 

III II I I I II II I I II I I I II I II I II I I II I II I I I I I I I I III I I II 
1261 GAGTCAGCTCGGGGCCTTGATGGGAGCAGCCATGTGGTCATGTATCTGGGTACCTCCACG 132 0 

1425 GGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATT 1484 

Mill II I II II II II I M I I I II M I II I II II I II II Mill M M II 

1321 GGGTCCCTGCACAAGGCTGTGGTGCCTCAGGACAGCAGTGCTTATCTCGTGGAGGAGATT 1380 

1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

M I II I I II I M I MM I II II I M II I I I I II I II I I I II II II I I I I I M II 
1381 CAGCTGAGCCCTGACTCTGAGCCTGTTCGAAACCTGCAGCTGGCCCCCGCCCAGGGTGCA 1440 

1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I I I II I I I I II II II I Mill II II I M II III I I I II I M I I M II II 
1441 GTGTTTGCAGGCTTCTCTGGAGGCATCTGGAGAGTTCCCAGGGCCAATTGCAGTGTCTAC 1500 

1605 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1664 

I | | I I I I I I II I II II M II II II II I I I II II II I M I M I I I I M I II I I I II 

1501 GAGAGCTGTGTGGACTGTGTGCTTGCCAGGGACCCTCACTGTGCCTGGGACCCTGAATCA 1560 

1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

M III II II I II I II I I I I I I I M M II II I II I II I II M 
1561 AGACTCTGCAGCCTTCTGTCTGGCTCTACCAACAGGCCTTGGAAGCAGGACATGGAACGC 162 0 

1725 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 17 84 

M Mill II II II I III M I I II II I I I II I I I I I I II MM II I I II I 

1621 GGCAACCCGGAGTGGGTATGCACCCGTGGCCCCATGGCCAGGAGCCCCCGGCGTCAGAGC 1680 

17 85 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I M I Ml I M I II I M M II II I I I I M II II II II I I I I I I I II I I M M M 

1681 CC C C CT CAACTAAT T AAAGAAGT C CT GACAGT C CC CAACT C CAT C CT G GAG CT GC C CT GC 1740 

1845 C C C C AC CT GT CAGCCT T GG C CT CT T AT TAT T GGAGT CAT GGC C C AG CAGC AGT C C C AGAA 1904 

M II I II II M II I II I II II II I I I II I II M M I I I I I I I I I I M M 
1741 CCCCACCTGTCAGCACTGGCCTCTTACCACTGGAGTCATGGCCGAGCCAAAATCTCAGAA 1800 

1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I II I I I I II II I II I I II II M II II II II I II I I M I II II I M I I I M 
1801 GCCTCTGCTACCGTCTACAATGGCTCCCTCTTGCTGCTGCCGCAGGATGGTGTCGGGGGC 18 60 

1965 CT CTACCAGT GCT GGGCAACT GAGAAT GGCT TTTCATAC CCT GT GAT CTC CTACT GGGTG 2024 



Db 



lllllllllll II I I I I II I I I I I I i IIIIIIMIIII llllllt Mill 

1861 CTCTACCAGTGTGTGGCGACTGAGAACGGCTACTCATACCCTGTGGTCTCCTATTGGGTA 1920 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2025 GAC AGC C AGGAC C AGAC CCTGGCCCTG GAT C CT GAACT GGCAG GC AT C C C C C GGGAGC AT 2 084 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I III I I II I I I I II I 

1921 GACAGCCAGGACCAGCCCCTGGCGCTGGACCCTGAGCTGGCGGGCGTTCCCCGTGAGCGT 198 0 

2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

III I I I I I I I I lllllllllll I II II II M I I I I I I I I I I I I I 

1981 GTGCAGGTCCCGCTGACCAGGGTCGGAGGCGGAGCTTCCATGGCTGCCCAGCGGTCCTAC 2040 



2145 



TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I II I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I II I 

2041 TGGCCCCATTTTCTCATCGTTACCGTCCTCCTGGCCATCGTGCTCCTGGGAGTGCTCACT 2100 

2205 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2264 

Mill I II I I I I I I M I II I I lllllllllll I I I I I I I I I I II I I I I I 
2101 CTCCTCCTCGCTTCCCCACTGGGGGCGCTGCGGGCTCGGGGTAAGGTTCAGGGCTGTGGG 2160 

2265 ACCCTGCGCCC 2275 

I I I I I I I I 
2161 ATGCTGCCCCC 2171 



RESULT 6 

BX367242/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Craniata; Vertebrata; Euteleostomi ; 



BX367242 1114 bp mRNA linear EST 08-MAY-2003 

BX367242 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL002YO04 3-PRIME, mRNA sequence. 
BX367242 

BX367242.1 GI: 30455608 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1114) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 907. f For 
more information about this cluster,, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster.cgi?seq=CS0AL002BH02NPl&cluster=907.f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0AL002BH02NP1 . 

Location/Qualif iers 

1. .1114 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db xref="taxon:9606" 



/clone="CS0DL002YO04 " 

/cell_type="B CELLS (RAMOS CELL LINE) COT 2 5 -NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
2 5 -NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 



Query Match 30.2%; Score 950.6; DB 13; Length 1114; 

Best Local Similarity 94.8%; Pred. No. 1.7e-220; 

Matches 996; Conservative 24; Mismatches 27; Indels 4; Gaps 4; 

Qy 2073 CCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCC 2132 

I I M I I I I I I I I I I I I I I I I I I I I I I I : I i I I I I I I I I I : I I I I : I I I I I I I I I I I I 
Db 1055 CCCCCGGAGCATGT-AAGGTCCCGTTGACMAGGGTCAGTGG-KGGGCSGCCCTGGCTGCC 998 

Qy 2133 CAGCAGTCCTACTGGCCCC-ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTC 2191 

I | I : M I I : : I II I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I II I I I I I I I I I I I 
Db 997 CAGMAGTCMYACTTGCCCCAACTTTGTAACTGTAACTGTCCTCTTTGCCTAAGTGCTTTC 938 



2192 AGGAGCCCTCATCATCCTCGTGGCCTCCCC-ATTGAGAGCACTCCGGGCTCGGGGCAAGG 2250 
I | | I I I I i I II i I I I II II I I I I I I I I I I I I I I I I I I I : I I I 1 I II I I I I I I MINI 
937 AG GAGC CCT CAT CAT C CT CGT GGC CT C C C CAAT TGAGAGMACT CC GGGCT C GGC GCAAGG 878 

2251 TTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACC 2310 



I I : I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 877 TTMAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACC 818 

Qy 2311 TCCAGTCTCCCAAGGAAT GCAGGACCTCTGCCAGT GATGTGGACGCT GACAACAACTGCC 237 0 

I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 817 T C C AGT CT CC CAAG GAAT GC AGGAC CT C T GC CAGT GAT GT GGAC GCTAACAACAACT GCC 758 

Qy 2371 TAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGC 2430 

I | | | | | M I I I I I : I I I I I I I ! I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 

Db 757 TAGGCACTGAGGTMGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGC 698 

Qy 2431 CAT GCT GGCT GGGCGGCCCAAGCACAGCCCT GACT AGGAT GACAGCAGCACAAAAGACCA 2490 

I I I I I I I I I I I I I I I I : I I I I I I I I I I I I M I I I : I I I I I I I I I I I I I I I I I I I 

Db 697 CATGCTGGCTGGGCGGCCCAAGMACAGCCCTGACTAGGATSACAGCAGCACAAAAGACCA 638 

Qy 2491 CCTTT CT CCCCTGAGAGGAGCTT CT GCTACT CT GCAT CACT GAT GACACT CAGCAGGGT G 2550 

I I I I I I I II I I I I I II I I I I I I I I I I I : I I II I I : I I I I I I I I I 

Db 637 CCTTTCTCCCCT GAGAGGAGCTT CT G C TACT CT GC ATMACT GAT VAC ACT CAGCAG GGT G 57 8 

Qy 2551 AT GCACAGCAGTCTGCCT CCCCTATGGGACT CCCTTCTACCAAGCACATGAGCT CTCTAA 2610 

Ml I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 577 ATGAACAGCAGTCTGCCTCCCCTATGGAACTCCCTTCTACCAAGCACATGAGCTCTCTAA 518 



2611 CAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCTGGAGAGGAT 2 670 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
517 CAGGGT GGGGGCTAC CCCCAGACCT GCT CCTAAACT GAT ATT GAAGAAC CT GGAGAGGAT 458 



2671 CCTT CAGTTCT GGCCAT T CCAGGGACCCT CCAGAAACACAGT GTT T CAAG AG AC CCT AAA 2730 
I | | | | | || | | | I | | I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I 



Db 


457 


C CTT C AGT T CT GGC C AT T C CAGGGAC C CT C C AGAAAC ACAGT GTT T CAAGAGAC C CT AAA 


398 


Qy 


2731 


AAAC CT GC CT GT CCCAGGAC CCTAT GGT AAT GAACACCAAACAT CT AAACAAT CAT AT GC 
1 1 1 1 1 1 1 1 • II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 I 1 III 1 1 1 1 1 1 

| 1 | 1 | | | | t 1 | 1 ! | I | | 1 1 1 1 1 II M 1 M 1 1 1 1 1 1 1 1 1 ' 1 1 1 1 1 1 1 M 1 II) 1 1 1 1 1 > 

AAAC CT G CMT GT C C C AG GAC C C TAT GGT AAT G AAC AC C AAAC AT CT AAAAAAT AAT AT G C 


2790 


Db 


397 


338 


Qy 


2791 


TAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCT 

1 1 1 *! 1 1 1 II 1 M 1 II 1 1 1 1 1 1 : 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 : 1 1 1 1 1 1 1 1 1 II 1 
iii*iiii i i i i i i j i i i i i i i • i • i i i i i i i i ■ ■ i • ■ ■ ■ i • ■ i'iiiii iiiiiii 

TAAMATGCAACTCCTGGAAACTCMAMTCTGAAGCTGCCGCTTTGAAMACCAAAACTCCCT 


2850 


Db 


337 


278 


Qy 


2851 


TCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCT 

1 II 1 1 1 1 1 1 I 1 1 1 1 1 • 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 II 1 1 1 1 : 1 1 Ml 
i i i i i i i i i I i i i i i * i i i i i i i i i i i i i i i i i i i < ■ ■ i ■ i ■ ■ ■ • ■ * ■ ■ ■ i ■ ■< iii 

TCTCCCAGGGTCATGMAGGGATCTGCTCCCTCCTGCTTCCCTTACMAGTCGTGMACAGCT 


2910 


Db 


277 


218 


Qy 


2911 


GACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAG 

1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 III 1 1 1 1 1 1 II 1 1 : 1 1 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i iii i i t i i i i i i i i i 

AACTCCCAGGAAGTCTTCCCTGAAGTCTGACCACCTTTCNTCTAGCTTAAGTTGGRGAAA 


2970 


Db 


217 


158 


Qy 

Db 


2971 
157 


ACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTT 
1 1 1 1 M 1 1 1 1 1 1 1 II it 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 IIIIIII 

1 1 1 1 t 1 1 1 1 1 \ 1 I 1 J I t 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 IIIIIII 

ACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATNTGAGCCTTCTTAACTCCTT 


3030 
98 


Qy 

Db 


3031 
97 


TACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAA 

I | | | | | | | | | | | | I I I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 
TACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAA 


3090 
38 


Qy 


3091 


ACT GCT T GT C AGAGACT GT TT AT T T T T TAT T 3121 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 

ACTGCTTGTCAGAGACTGTTTCBYTTTTCTT 7 




Db 


37 
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BX363741/c 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX363741 1201 bp mRNA linear EST 05-MAY-2003 

BX363741 Homo sapiens B CELLS (RAMOS CELL LINE) COT 2 5-NORMALI Z ED 
Homo sapiens cDNA clone CS0DL005YC17 3-PRIME, mRNA sequence. 
BX363741 

BX363741. 1 GI: 30384744 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1201) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r , Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 907. f For 
more information about this cluster, see 
http: //www. genoscope . ens . f r/ 

cgi-bin/cluster.cgi?seq=CSODL005AB09NPl&cluster=907. f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 



http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DL005AB09NP1 . 
FEATURES Location/Qualifiers 
source 1. .1201 

/organisnv="Homo sapiens 11 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 



Query Match 29.5%; Score 927.8; DB 13; Length 1201; 

Best Local Similarity 95.4%; Pred. No. 6.6e-215; 

Matches 1001; Conservative 16; Mismatches 24; Indels 8; Gaps 



Qy 


2058 


GAACT G GC AGG CAT C C C C C G GGAG CAT GT GAAGGT C CC GT T GAC C AG GGT CAGT GGT GGG 
Mill Mill II II : 1 : 1 II 1 1 1 1 1 1 1 1 1 : 1 1 1 1 M 1 1 1 1 1 1 1 
GAT C T GAAT G GCAGC AT C C C C GGGAGMWG KGARGT C C C GT T GAC C - RGGT CAGT GGT G GG 


2117 


Db 


1042 


984 


Qy 


2118 


GCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTT 

I || I : 1 1 1 1 1 II 1 II 1 1 : 1 : II III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

— CCGCCCTGGYGCCCAGCAGTCCWAYTG — CCCCATTTGTCACTGTCACTGTCCTCTTT 


2177 


Db 


983 


928 


Qy 


2178 


GCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGG 

1 1 M 1 1 1 II 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 II i 1 1 1 i 1 1 1 1 1 1 1 1 1 
GCCTTAGTGCTTTCA-GAGCCCTCATCATCCTCGT-GCCTCCCCATTGAGAGCACTCCGG 


2237 


Db 


927 


870 


Qy 


2238 


GCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGC 

I | | i | | I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 M II 1 1 1 1 1 1 1 1 1 1 

GCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGC 


2297 


Db 


869 


810 



Qy 2298 AGAGAGCAACACCT C CAGT CT C C CAAGGAAT GCAGGAC CT CT GC CAGT GAT GT GGAC G CT 2357 

I M I I I I II I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 8 09 AGAGAGCAACACCT C C AGT CT C CCAAGGAAT GCAGGAC CT CT GC C AGT GAT GT G GAC GCT 750 

Qy 2358 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 2417 

I I I I I I I I I I I I I I I I II I I I I I I I I i I I I I I I I M I I I I I I I I I I I M I I I I I I 

Db 749 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 690 

Qy 2418 GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 2477 

| I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I II 

Db 689 GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 630 

Qy 2478 GCACAAAAGACCACCTTT CT CC C CT GAGAGGAGCTT CTGCTACTCT GCAT CACT GAT GAC 2537 

| || | | | | || I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I M I M I I I I I I I I M I I I I 

Db 629 GCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGATGAC 57 0 

Qy 2538 ACT C AGC AG GGT GAT G C AC AG CAGT CTGCCTCCC CT AT G GGAC T C C CT T CT AC C AAG C AC 2597 

I | I | | I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I M I I I M I I I I I I 
Db 569 ACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCAC 510 



Qy 


2598 


Db 


CAQ 

ouy 


Qy 


2658 


Dd 


A A Q 

4 4 y 


Qy 


2718 


Db 


joy 


Qy 


2778 


Db 


jz y 


Qy 


2838 


Db 


o <c o 

z by 


Qy 


2898 


Db 


o n o 

z 09 


Qy 


2958 


Db 


14 y 


Qy 


3017 


Db 


89 


Qy 


3077 


Db 


29 



I I I I I j M I I I I I I I I I M I I I M M I I I I M I I I I I I I 1 I I I I I I M I I I I I I I M I I I 

ATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGA 450 

ACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTCCAGAAACACAGTGTTTC 2717 
| | | | | | | | M I I I I I I I II I I I I I I I I II I I I I I I I I I I II I I M I I I I I I 1 I I I M I II 
ACCT GGAGAGGAT CCTT CAGTT CT GGC CATT CCAGGGACCCT CCAGAAACACAGT GTTT C 390 



| | | | | | | | I I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I I I I I M I I I I I II I I I I I 
AAGAGAC C CTAAAAAAC CTGCCTGTCC C AGGAC C CT AT G GT AAT GAAC AC CAAAC AT CT A 330 

AACAAT CAT AT GCT AAC AT GC C ACT C CT G GAAACT C CACT CT GAAGC TGCCGCTT T GGAC 2837 

| | | | | | | I i || I I I II I I I I II I I I I I I II I I I I I I I I I I I M I M I I i I I I II I I M II 

AACAAT CAT AT GCTAACAT GCCACT C CT GGAAACT CCACT CT GAAGCT GCCGCTTT GGAC 27 0 

ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 2897 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 

ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 210 

GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 2957 

| | | | | | | | | I I || I I M : I I I I I I I I I I I I I I I I I I : I I M I I I I I M I I I II I I I I I I 
GTCGTGCACCGCTGACTYCCAGGAAGTCTTCCCTGAAKTCTGACCACCTTTCTTCTTGCT 150 

TCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG-CAGGGGTAATCTGAGC 3016 

I ill II M I I I 111:1:1 II II It i I I II Ml I ! hill I I M I I I I I I I I I I I I I I I I 
TCAGTTGGGGCAGAYTYTGATCCCTTCTGCCCTGGYAGAATGGTCAGGGGTAATCTGAGC 90 

CTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTT 3076 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : II I I I I I I I : I :: I I I I M I II I I I I 
CTTCTTCACTCCTTTACCCTAGCTGACCCCTTCMCCTCTCCCCBTSSCTTTTCCTTTGTT 30 

TT GGGAT T C AGAAAACT GCT T GT CAG AGA 3105 
I I I I I I I I I I I I I I I M I I I II I I I I I : I 
TT GGGATT CAGAAAACT GCTT GT CAGAKA 1 



RESULT 8 

BX350606/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX350606 922 bp mRNA linear EST 05-MAY-2003 

BX350606 Homo sapiens B CELLS (RAMOS CELL LINE) COT 2 5 -NORMAL I Z ED 
Homo sapiens cDNA clone CS0DL005YC17 3-PRIME, mRNA sequence. 
BX350606 

BX350606.1 GI: 30373499 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota; Metazoa; 
Mammalia; Eutheria; 
1 (bases 1 to 922) 
Li,W.B. , Gruber, C. , 



Chordata; Craniata; Vertebrata; Euteleostomi ; 
Primates; Catarrhini; Hominidae; Homo. 



and Polayes,D. 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 



Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 907. f For 
more information about this cluster, see 
http://www.genoscope.cns.fr/ 

cgi-bin/cluster,cgi?seq=CS0BAI043ZD06_CS04076__l6cCluster=907 .f . 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0BAI043ZD06_CS04076_1 . 
FEATURES Location/Qualifiers 
source 1. -922 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="CS0DL005YCl7 " 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/ eel l_line=" RAMOS CELL LINE" 

/cloneJLib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 

Query Match 27.8%; Score 874.4; DB 13; Length 922; 

Best Local Similarity 98.7%; Pred. No. 6.3e-202; 

Matches 878; Conservative 0; Mismatches 12; Indels 0; Gaps 0; 

CCCAGGGCCTTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGC 1431 

Mill! I I I I I I II I I I I I I I I I I i M I I I II I I I I I I I I I I I I I I I I I i I I II I I I 
CC CAGGN CCTT GAT G GGCACAG C CAT C TT GT CAT GT ACT T GG GAAC CACAAC AG G GT C GC 860 

T C CACAAGGCT GT GGTAAGT GGGGACAGC AGT GCT CAT CT G GT GGAAGAGAT T CAGCT GT 1491 
| M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T CCACAAGACT GT GGTAAGT GGGGACAGC AGT GCT CAT CT GGT GGAAGAGAT T CAGCT GT 800 

TCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTG 1551 

I | | M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
TCCCTGACCCTGANCCTGTTCGCAACCTGCAGCTGGCCNCCACCAAGGGTGCAGTGTTGN 740 

TAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCT 1611 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

T AGGCT T CT CAGNAGGT GT C T G GAGGGT G CN C C GAGCCAACT GT AGT GT CT AT GAGAGCT 68 0 

GTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCT 1671 

I | | | | | | || || | II I I I I I I I I I I I II I I I I I I M I I I I I I I I M I I I I I M I II I I II I 
GTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCT 62 0 

GTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACC 1731 

I I I I I I II I I I II I I I I I II I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

GTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACC 560 
CAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGC 1791 

1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 ll 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 M 1 1 1 1 1 

CAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGC 500 



Qy 


1372 


Db 


919 


Qy 


1432 


Db 


859 


Qy 


1492 


Db 


799 


Qy 


1552 


Db 


739 


Qy 


1612 


Db 


679 


Qy 


1672 


Db 


619 


Qy 


1732 


Db 


559 



Qy 


1792 


Db 


499 


Qy 


1852 


Db 


439 


Qy 


1912 


Db 


379 


Qy 


1972 


Db 


319 


Qy 


2032 


Db 


259 


Qy 


2092 


Db 


199 


Qy 


2152 


Db 


139 


Qy 


2212 


Db 


79 



AAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACC 1851 

I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGCTCCCCTGCCCCCACC 440 

T GT CAGC CT T G G C CT CT T AT TAT T G GAGT CAT GG C C CAGCAGC AGT C C C AGAAGC CT CT T 1911 

I I I I I I I I 1 I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTT 380 

CCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACC 1971 

I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACC 320 

AGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCC 2031 

| M I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

AGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCC 2 60 

AGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGG 2 091 

I M I I M I I I I I I I II i I I I I I I I I II I II I I I I M I I I II I I I I I I I I I I I I I I I I I I I 

AGGAC C AGAC CCTGGCCCT GGAT C CT GAACT GGC AGGC AT C CC C CG GGAGCAT GT GAAGG 2 00 
TCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCC 2151 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I M I I I I I I I I I I I M I I I I I I I 

TCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCC 140 
ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCG 2211 

| | I I II I I I I I I I II I I I I I I I I I I I I I II I I I I M I I I I I I I I I I M I I I I I i I I I I I I 

ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCG 8 0 
TGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGT 22 61 

I | | 1 1 || | 1 1 1 I 1 1 II 1 1 I I I I I I II i 11 1 I 1 1 1 II 1 1 I II I I I II I I I I 

TGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGT 3 0 



RESULT 9 
BX328255 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



GI:30307730 



BX328255 926 bp mRNA linear EST 01-MAY-2003 

BX328255 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 5-PRIME, mRNA sequence. 
BX328255 
BX328255.1 
EST. 

Homo sapiens 
Homo sapiens 
Eukaryota ; Metazoa ; 
Mammalia ; Eutheria ; 
1 (bases 1 to 926) 
Li,W.B., Gruber,C, 



(human) 



Chordata; 
Primates; 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 

and Polayes,D. 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 907. f For 
more information about this cluster, see 

http://www.genoscope.cns . f r/cgi-bin/cluster . cgi?seq=CS0BAG053ZH06_C 



S05040_l&cluster=907 . f . Contact : Feng Liang Email : 
fliang@lifetech.com URL : http://fulllength.invitrogen.com/ 
InVitroGen Corporation 1600 Faraday Avenue Genoscope sequence ID : 
CSOBAG053ZH06_CS05040_1. 
FEATURES Location/Qualifiers 
source 1. .926 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 2 5 -NORMALIZED" 
/cell_line= "RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
2 5 -NORMALIZED 11 

/note="lst strand cDNA was primed with a Notl-oligo (dT ) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 



Query Match 27.3%; Score 856.6; DB 13; Length 926; 

Best Local Similarity 98.1%; Pred. No. 1.4e-197; 

Matches 909; Conservative 0; Mismatches 14; Indels 4; Gaps 



Qy 


805 


TGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGG-AGACAGCCAGCGAG 

I I i l l l l l I l M 1 1 1 1 1 II 1 1 1 I 1 II 1 1 1 1 1 1 M I 1 1 1 I 1 1 1 1 1 1 t 1 II 1 1 1 1 1 1 1 1 I 1 
| | | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I M 1 II 1 1 1 1 1 II ! 1 1 1 I M 1 1 N II i II II l M l I 

T GGC AGC CAT CC CTTC GAC C CAGGT C GT CT ACT T CTT CT T C GAGGAAGAC AGC C AG C GAG 


863 


Db 


1 


60 


Qy 


864 


TTT GACTTCTTT GAGAGGCT CCACACAT CGCGGGT GGCT AGAGT CT GCAAGAAT GAC GT G 

I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 I 1 I 1 1 1 1 1 1 1 M II 1 1 1 i 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 i 1 1 

TTT GACTT CT TT GAGAG GCT C C ACAC AT C G C GGGT GGCT AGAGT CT GCAAGAAT GACGT G 


923 


Db 


61 


120 


Qy 


924 


GGCGGCGAAAAGCT GCT GCAGAAGAAGTGGAC CAC CTT CCT GAAGGC CCAGCT GCT CT GC 

I | I || I I I 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 II i 1 1 1 1 1 1 1 i i I 1 1 

GGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGC 


983 


Db 


121 


180 


Qy 


984 


ACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGAT 

I | | | | | M || I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

ACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGAT 


1043 


Db 


181 


240 


Qy 


1044 


T CT C C C ACAGCT C C C CAC AT CT AC G CAGT CTT CAC CT C C CAGT GGC AG GT T G GCGG GAC C 

| M II 1 1 1 1 1 1 II 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 
TCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACC 


1103 


Db 


241 


300 


Qy 


1104 


AGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAA 

| | | I I I I I I 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 I 1 1 II 1 1 M 1 1 1 II 1 1 1 1 1 ! II 1 1 1 1 

AGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAA 


1163 


Db 


301 


360 


Qy 


1164 


T ACAAAGAGTT GAACAAAGAAACTT CAC GCT GGACTACT T AT AG GGGC CCT GAGAC CAAC 

| | | || I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 II 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

T ACAAAGAGT T GAACAAAGAAACT T CAC GCT GGACTACT TAT AGGGG C CCT GAGAC CAAC 


1223 


Db 


361 


420 


Qy 


1224 


CCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAG 

I I I 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAG 


1283 


Db 


421 


480 


Qy 


1284 


GACCATTT CCT GAT GGATGAGCAAGT GGT GGGGACGCC CCT GCTGGT GAAAT CT GGCGTG 


1343 



TM-v 

Dd 


A Q 1 

4 o 1 


Qy 


1344 


DD 


O ft X 


Qy 


1404 


Dd 


bUi 


Qy 


14 64 


Db 


bol 


Qy 


1524 


Dd 


/ z 1 


Qy 


1582 


Db 


TQ1 
/ O 1 


Qy 


1642 


Db 


841 


Qy 


1702 


Db 


900 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTG 54 0 
GAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGCCATCTTGTC 14 03 

M I I I I II I I I I I I I I I I I I I I I M I I I M I I 1 I I I I 1 i I I M I I I I I I I I I I I I I I I I I 

GAGT AT ACAC G GCT T GC AGT GGAGAC AG C C C AGG GC CT T GAT GGGCAC AG C CAT CT T GT C 600 

AT GT AC CT GGGAACCAC CACAGGGT CGCT CCACAAGGCT GT GGTAAGT GGGGACAGCAGT 1463 
| | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I 1 I I I I I I I I I I 
AT GTACCT GGGAACCAC CACAGGGT CGCTCCACAAGGCT GT GGTAAGT GGGGACAGCAGT 660 

G CT C AT CT G GT GGAAGAGAT T C AGCT GT T C C C T GAC C CT GAAC CT GT T C GCAAC CT G C AG 1523 

I | | | I | | | || I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I II 

GCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAG 720 

CTGGCCCCCACCCAGGGTGCA-GTGTTTGTAGGCTTCTCAGGAGGTGTCTGG-AGGGTGC 15 81 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGCCCCCACCCCAGGTGCANGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGNAGGGTGC 7 8 0 

CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCC 1641 

I | | | | | I | I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I MINIM 

CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCCGGACCCCC 840 
ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACT 1701 

M I M M I II I I M I II II II II I I I II I M I II I I II II I II II II I II II Ml 

-CTGTGCCTGGGACCCTGAGTCCCGACCCTGTTGCCTTCTGTCTGCCCCCAACCTTGACT 8 99 

CCTGGAAGCAGGACAT GGAGCGGGGGA 1728 

II I I I I II II I I I I II I I I I 

C CTT GGAAGCAGACAT GGAGCGGGGAA 926 



RESULT 10 

BX384966 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX384966 1201 bp mRNA linear EST 08-MAY-2003 

BX384966 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 5-PRIME, mRNA sequence. 
BX384966 

BX384966.1 GI: 30436505 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 1201) 
Li,W.B., Gruber,C, Jessee,J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr f Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 907. f For 
more information about this cluster, see 
http: //www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DL005AB09QPl&cluster=907 . f . Contact : 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 

and Polayes,D. 



Feng Liang Email : f liangSlif etech . com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DL005AB09QP1 . 
FEATURES Location/Qualifiers 
source 1. .1201 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DL005YC17 " 

/cell_type="B CELLS (RAMOS CELL LINE) COT 2 5 -NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
2 5 -NORMAL I ZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 

Query Match 27.0%; Score 849.2; DB 13; Length 1201; 

Best Local Similarity 97.0%; Pred. No. le-195; 

Matches 871; Conservative 4; Mismatches 22; Indels 1; Gaps 1; 

CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 158 

M | | I I I I M I I I I I II I I I I I I I I I I I I I I I i I I i I I I M I I I I I I I I I I I I I I I II M 
CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 127 

TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 218 

1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 

TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 187 
AT GC C CAG GGT CAGAT ACT AT GCAGGG GAT GAAC GTAGGGCACTT AGCTT CT T C CACC AG 27 8 

I | | | | I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I M I I I II I I I I I I I I I I I 

ATGCCCAGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAG 247 

AAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTG 338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGCTGATGGAAATACTCTCTACGTG 307 

GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 398 

I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I M I I II II I I I I M I I I I I I I M I I I I I 

GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 367 
AACAT GATACCGTGGCCAGCCAGTGACAGAAAAAAGAGT GAAT GTGCCTTTAAGAAGAAG 458 

I I I I I I I I I I I I I I I I II II I I I I I I Mill I I I I I I I I I I I I I I I I 

AACAT GAT ACCGT GGCCAGCCAGT GACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAG 427 
AGCAAT GAGAC AC AGT GT T T CAACT T CAT CCGTGTCCTGGTTTCT T AC AAT GT C AC C CAT 518 

I M I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I 

AG CAAT GAGAC ACAGT GT TT CAACT T CAT CCGTGTCCTGGTTTCT T AC AAT GT CAC C CAT 487 

CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 57 8 

| | | | | | | | | | | | | II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M M I 

CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 547 



Qy 


99 


Db 


68 


Qy 


159 


Db 


128 


Qy 


219 


Db 


188 


Qy 


279 


Db 


248 


Qy 


339 


Db 


308 


Qy 


399 


Db 


368 


Qy 


459 


Db 


428 


Qy 


519 


Db 


488 



Qy 



579 TCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 
I | | | | I | I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



638 



Db 



54 8 TCCTACCTGTTGCCCATCTCGGAGGACT^AGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 607 



Qy 639 GACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATG 698 

I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 1 1 I I I ! I I I I I I I I I I I I I I I I I I I 

Db 608 GACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATG 667 

Qy 699 AACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTC 758 

II I II I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 668 AACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTC 727 

Qy 759 AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 72 8 AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 787 

Qy 819 TCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAG 878 

I I I I 1 I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I 
Db 788 T C GAC C C AGGT C GT CT ACTT CT T CT T C GAG GAGACAGC CAGCGAGTT T GACT T CT TT GAG 8 47 

Qy 87 9 AGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTG 938 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I : I I I 

Db 84 8 AGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCG-AAARCTG 906 

Qy 939 CTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGC 996 

I I II I I I I I I I I I I I I II : I I I I I MM: : I I I I I II 
Db 907 CTGCAGAAGAAGTGGACCMCCTCCTGAAGCCCACYGCYCTCMCCAGCCCGGGCACTGC 964 



RESULT 11 

BQ057192 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BQ057192 974 bp mRNA linear EST 29-MAR-2002 

AGENCOURT_6769628 NIH_MGC_99 Homo sapiens cDNA clone IMAGE : 58 12383 
5 1 , mRNA sequence. 
BQ057192 

BQ057192.1 GI: 19816532 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 974) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r @mail . nih . gov 

Tissue Procurement: Lou Staudt 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at: 

http : //image . llnl . gov 

Plate: LLCM2062 row: 1 column: 16 

High quality sequence stop: 714. 
Location/Qualifiers 
1. .974 

/organism="Homo sapiens" 



/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/ clone= " IMAGE : 5 8 1 2 3 8 3 " 
/tissue_type="lymphoma, cell line" 
/lab_host="DH10B (phage-resistant ) " 
/clone_lib= n NIH_MGC_99 M 

/note="Organ: lymph; Vector: pOTB7; Site_l : Xhol; Site__2 : 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRI/XhoI sites using the following 5* adaptor: 
GGCACGAG (G) . Size-selected >500bp for average insert size 
1.8kb. Library constructed by Ling Hong in the laboratory 
of Gerald M. Rubin (University of California, Berkeley) 
using ZAP-cDNA synthesis kit (Stratagene) and Superscript 
II RT (Life Technologies). Note: this is a NIH__MGC 
Library. " 

ORIGIN 



Query Match 26.3%; Score 827.4; DB 13; Length 974; 

Best Local Similarity 92.6%; Pred. No. 1.9e-190; 

Matches 902; Conservative 0; Mismatches 67; Indels 5; Gaps 3; 



Qy 


yz 


1 i | i | | 1 1 i I I II I 1 1 1 i 1 I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I i 1 

TCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCT 


151 


Db 


i 


60 


Qy 


1 RO 


1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCA 


211 


DD 


Dl 


120 


Qy 


212 


GG GGCC CAT GC C CAGGGT CAGATACT AT GCAGG GGAT GAAC GT AG GGCACTTAG CTT C TT 

| | | | | | I I I I I I M I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 t 1 1 1 
GGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTT 


271 


Db 


121 


180 


Qy 


272 


CCAC C AGAAGGGCCT C CAGGAT T T T GAC ACT CT GCT C CT GAGT GGT GAT GGAAAT ACT CT 

1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 

C C AC C AGAAG GG C CT C CAGGAT T TT GACACT CT GCT C CT GAGT GGT GAT G GAAAT ACT CT 


331 


Db 


181 


240 


Qy 


332 


CTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAG 


391 


Db 


241 


300 


Qy 


392 


GCTAAAGAACAT GATACCGT GGCCAGCCAGT GACAGAAAAAAGAGTGAAT GT GC CTTTAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 

GCTAAAGAACAT GATAC CGT GGCCAGCCAGT GACAGAAAAAAGAGT GAAT GT GCCTTTAA 


451 


Db 


301 


360 


Qy 


452 


GAAGAAGAGCAAT GAGACACAGT GT T T CAACTT CAT CCGT GT C CT GGTTT CT T ACAAT GT 

II II 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GAAGAAGAGCAAT GAGACACAGT GT T T CAACTT CAT CCGTGTCCTGGTTT CT T ACAAT GT 


511 


Db 


361 


420 


Qy 


512 


CACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACT 

I | | | | | | I I I M I 1 1 1 1 1 1 II 1 II II II 1 1 1 II 1 1 1 1 M 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 I 1 1 

CACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACT 


571 


Db 


421 


480 


Qy 


572 


T CAAGATT CCTACCT GTT GC CCAT CT C GGAGGACAAGGT CAT GGAGGGAAAAGGCCAAAG 

1 1 1 1 II 1 1 II 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 

T CAAGATT C CT AC CT GT T G C C CAT CT C GGAGGACAAGGT CAT GGAGGGAAAAGG CCAAAG 


631 


Db 


481 


540 



Qy 

Db 



632 CCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGG 691 

I I I I I I I I I I ! I I I I I I I I I I I I I I I i I I I I I 1 I I I I I I I I I I I M I I I I I I I I I I I I I I 
541 CCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGG 600 



Qy 692 TACT AT GAACAACTT C CT GG GC AGT GAGC C CAT C C T GAT G CGC ACAC T G G GAT C C CAG C C 751 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TACT AT GAAC AAC T T CCT GG GC AGT GAGC CCAT C CT GAT G C GCACACT GGGAT C C CAGC C 660 

Qy 752 TGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGC 811 

I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 661 TGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGC 72 0 

Qy 812 CAT C C CT T C GAC C C AGGT C GT CT ACT T CT T C T T C GAGGAGACAG C CAGC GAGT T T GACTT 871 

| | | | | | | | | | I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II II I I II I 
Db 721 CATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGGAGAGACAGCCAGCGAGTTTGACTT 78 0 

Qy 872 CTTTGAGAGGCTCCACACATCGCGGGTGG-CTAGAGTCTGCAAGAATGACGTGGGC-GGC 92 9 

1 1 I I I II I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I III 

Db 781 CTTTGAGAGGCCCCCACCCTCCCGGGGGGCCTANAGTCTGCCAAAATGACGTGGGCGGGC 840 

Qy 930 GAAAAGCT G CT GCAGAAGAA GTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACC 986 

I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I M 

Db 841 GAAAAGCTGCTGCAAAAAAAAGTGGACCCCCCTTCCTTGAAGGCCCAGCTGCTCTGGCCC 900 

Qy 987 CAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCT 104 6 

I I I I I I I Ml I I I I I I I I I I I I 

Db 901 CCAGCCGGGGGGAGCTTGCCCTTTCACGTCATTCCCGCCCCCGGGGTCCTGGCTCCCCCC 960 

Qy 1047 CCCACAGCTCCCCA 1060 

III I I I I I I 

Db 961 CCGAATTTTCCCCA 974 



RESULT 12 
BX390196 

LOCUS BX390196 960 bp rtiRNA linear EST 08-MAY-2003 

DEFINITION BX390196 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 

cDNA clone CS0DD003YE08 5-PRIME, mRNA sequence. 
ACCESSION BX390196 

VERSION BX390196.1 GI: 30463276 

KEYWORDS EST . 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 960) 

AUTHORS Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
TITLE Full-length cDNA libraries and normalization 

JOURNAL Unpublished (2001) 
COMMENT Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 907. f For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 



cgi-bin/cluster. cgi?seq=CSOBAG009ZD12_CS00860__l&cluster-907 . f . 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CSOBAG009ZD12__CS00860_1 . 
FEATURES Location/Qualifiers 
source 1. .960 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="CS0DD003YE08" 

/tissue_type= "NEUROBLASTOMA COT 50-NORMALIZED" 
/clone__lib="Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 

Query Match 26.2%; Score 822.2; DB 13; Length 960; 

Best Local Similarity 97.2%; Pred. No. 3.6e-189; 

Matches 900; Conservative 0; Mismatches 19; Indels 7; Gaps 6; 

CCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCC 15 8 9 

Ml | | | | | | | | | | I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCACCAGGGTGCAGTGTTTGTAGGCTTCT-AGGAGGTGTCTGGAGGGTGCCCCGAGCC 68 

AACT GT AGT GT CTAT GAGAGCT GT GT GGACT GTGT CCTT GCCCGGGAC CCC CACT GT GCC 164 9 

M M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCC 12 8 
TGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAG 17 09 

I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

TGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAG 188 

CAGGACATGGAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGC 17 69 

| | | | | | | || | I I I I I M I I I I I I I I I I I I I I I I I I II I I I II I I I M I I I I I I I I I I M I 

C AGGACAT GGAGC GG G GGAAC C CAGAGT G GGCAT GT GC CAGT GGC C C CAT GAGCAGGAGC 248 

CTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATC 1829 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 
CT T C GGC CT CAGAGCCGCCCGCAAAT CAT TAAAGAAGTCCTGGCTGTCCCTAACTC CATC 3 08 

CTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCA 1889 

I | | | | | | || | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I M I I I I 

CTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCA 368 
GCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAG 194 9 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I 

GCAGCAGT CCCAGAAGCCT CTT CCACT GT CT ACAAT GGCT CCCTCTTGCT GAT AGT GCAG 42 8 

GATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTG 2009 

| | | I I I I I M I I I I I I II I I I I I I I II I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I 

GATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTG 4 88 

ATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGC 2 069 

II I I I I I I I I I I I I I I I I II I I I I II I I I I I M I I I I I I I I I II I I I I I I I I I I I I M I I 

ATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGC 54 8 



Qy 


1530 


Db 


10 


Qy 


1590 


Db 


69 


Qy 


1650 


Db 


129 


Qy 


1710 


Db 


189 


Qy 


1770 


Db 


249 


Qy 


1830 


Db 


309 


Qy 


1890 


Db 


369 


Qy 


1950 


Db 


429 


Qy 


2010 


Db 


489 



QY 


9 07 0 


a m r r r r c rz q rz a GC A T GT G AAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCT 

1 | | | I I 1 ! 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I 1 1 1 1 1 1 

ATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCT 


2129 


Db 


549 


608 


yy 


? i ^o 

Cm -L O \J 


arc rAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M II 1 

GCCCAGCAGTCCTACTGGCCCCACTNTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTT 


2189 




£0 q 


668 


Qy 




TrA^r^zxr^rrrTrATrATrrTrGTGGrrTrrrCATTGAGAGCACTCCGGGCTCGGGGCAAG 
M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 II 

TCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTTCGGGCAAG 


2249 
728 


Qy 




r*rpTr~ ArrrrTr^T(^AnArrrT(^ri^rrrTGGGG — AGAAGGCCCCGTTAAGCAGAGAGCAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTTCAAGGGCTGTGAGACCCTGCGCCCTGGGGGAGAAGGGCCCCGTTAAGCAGAGAGCAA 


2306 


DD 




788 


Qy 


9^07 


CA-CCTCC AGTCTC C CAAGGAAT GCAGGAC CT CT GCCAGT GAT GT GGACG- CT GACAACA 
M III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 II 1 1 1 1 1 II 1 1 1 1 II 1 1 1 
C AC C CTT CAGT CT C C CAAGGAAT GCAGGAC CT CT GC CAGT GAT GT GGGCGCCT GACAACA 


2364 


JJD 


7 ft Q 


848 


Qy 


2365 


ACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCA 

1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 Mill UN II 

ACTGCCTAGGCACTGAGGTAGCTTAAACTCTA-GCACAGCCCGGGCTTGCGGGGCAGCCA 


2424 


Db 


849 


907 


Qy 


2425 


CCTGGCCATGCTGGCTGGGCGGCCCA 2450 

II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCTGCCCATGCTGTGTGGGCGGCCCA 933 




Db 


908 





RESULT 13 

CB243787/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
MEDLINE 
PUBMED 
COMMENT 



CB243787 797 bp mRNA linear EST 12-FEB-2003 

UI-CF-FNO-agg-a-05-0-UI. si UI-CF-FNO Homo sapiens cDNA clone 
UI-CF-FN0-agg-a-05-0-UI 3 ! , mRNA sequence. 
CB243787 

CB243787. 1 GI: 28365431 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 



Craniata; Vertebrata; Euteleostomi; 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 797) 

Bonaldo,M.F. , Lennon,G. and Soares,M.B. 

Normalization and subtraction: two approaches to facilitate gene 
discovery 

Genome Res. 6 (9), 791-806 (1996) 

97044477 

8889548 

Contact: McCray, PB 
McCray Lab 
University of Iowa 

2024 University of Iowa Med Labs, Iowa City, IA 52242, USA 

Tel: 319 356 4866 

Fax: 319 356 7171 

Email : paul-mccray@uiowa . edu 

Tissue Procurement: Dr. M. J. Welsh, University of Iowa 



FEATURES 

source 



cDNA Library preparation: Dr. M. Bento Scares, University of Iowa 
cDNA Library Arrayed by: Dr. M. Bento Scares, University of Iowa 
DNA Sequencing by: Dr. M. Bento Soares, University of Iowa 
Clone Distribution: Researchers may obtain clones from Research 

Genetics (www.resgen.com) or from Open Biosystems 

(www.openbiosystems.com) . 

The following repetitive elements were found in this cDNA 
sequence: 1-46, >AT_rich#Low_complexity (matched compliment) 
Seq primer: M13 FORWARD 
POLYA=Yes . 

Location/Qualifiers 

1. .797 

/organism="Homo sapiens" 
/mol_type= "mRNA" 
/db_xref="taxon: 9606" 
/clone="UI-CF-FN0~agg-a-05-0-UI" 
/tissue_type="Human Lung Epithelial cells" 

/lab_host="DH10B (Life Technologies) (Tl phage resistant)" 
/clone_lib="UI-CF-FNO" 

/note="Organ: Lung; Vector: pT7T3-Pac (Pharmacia) with a 
modified polylinker; Site_l: EcoR I; Site_2: Not I; 
UI-CF-FNO is a subtracted cDNA library derived from two 
normalized Human lung epithelial cell libraries (ENl and 
DUl) The library was subtracted according to according to 
Bonaldo, Lennon and Soares, Genome Research, 6:791-806, 
1996. For additional information, contact: 
bento-soares@uiowa . edu 

TAG_TISSUE=Human Lung Epithelial Cell Lines untreated LPS 
6hr~to LPS 24h 
TAG_LI B=UI ~ CF- FN 0 
TAG S EQ= CT GCT CAGGT " 



ORIGIN 



Query Match 24.8%; 
Best Local Similarity 99.4%; 
Matches 781; Conservative 



Score 779.8; DB 14; Length 797; 
Pred. No. 7.3e-179; 
0; Mismatches 5; Indels 0; Gaps 



0; 



Qy 


2358 


Db 


797 


Qy 


2418 


Db 


737 


Qy 


2478 


Db 


677 


Qy 


2538 


Db 


617 


Qy 


2598 


Db 


557 



GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 2417 

| | | | | I I I I I M I I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I M I 
GACAACAACTGCNTAGGCACTGAGGTAGCTTAAACTNTAGGCACAGGCCGGGGCTGCGGT 738 

GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 24 77 

I | | | | M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
GCAGGCACCCGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGANTAGGATGACAGCA 678 

GC ACAAAAGAC C AC CTTTCTCCCCT GAGAGGAGCTT CT GCT ACT CT GCAT CACT GAT GAC 2537 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

GCACAAAAGACCAC CTTT CT CCCCT GAGAGGAGCTT CT GCT ACT CT GCAT CACT GAT GAC 618 

ACT CAGCAGGGT GAT GCACAGCAGT CT GC CT C CCCT AT GGGACT C CCTT CT ACCAAGCAC 2597 

I M | | I I II I I I I I I I II II I I I II I M I II I I I I I I I I I I I I 

ACT CAGCAGGGT GAT GCACAGCAGT CTGCCTCCCCTAT GGGACT CCCTTCT ACCAAGCAC 558 



II I II I I II II I I I I I II II I MIMI I i tl I M Mil M II ! II I II I I II I I 

ATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGA 4 98 



Qy 


2658 


Db 


497 


Qy 


2718 


Db 


437 


Qy 


2778 


Db 


377 


Qy 


2838 


Db 


317 


Qy 


2898 


Db 


257 


Qy 


2958 


Db 


197 


Qy 


3018 


Db 


137 


Qy 


3078 


Db 


77 


Qy 


3138 


Db 


17 



AC CT G GAGAG GAT C CT T CAGT T CT GG C CAT T C CAG GGAC C CT C C AGAAAC AC AGT GT T T C 2717 

I | | | | | | | | | | | | I I I I I II I I II I I I I I I I I I I I I I I I I I I t ! I I I I I II I I I I i I I I I 

ACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTCCAGAAACACAGTGTTTC 438 



| | | I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

AAGAGAC C CT AAAAAACCT G CCT GT CCT AGGAC C CT AT G GT AAT GAAC AC C AAACAT CT A 37 8 

AACAAT CAT AT GCT AACAT GCCACT C CT GGAAACT CCACT CT GAAGCT GC CGCTTT GGAC 28 37 
| | | | | | | | | | | | || | | I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I M I I I I I I I I I 
AACAAT CAT AT GCTAACATGCCACTCCT GGAAACT CCACT CT GAAGCT GCCGCTTT GGAC 318 

ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 2 8 97 

I | | | | || | | | | | || I I I I I II I II I I I II II I I I I I I I I II I I I M I I I I I II I I I I I I I 

ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 258 

GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 2957 

| | | | | | I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I M I I I I I I 

GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 198 

TCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCC 3017 

| | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T CAGTT GGGGCAGACT CT GAT CCCTT CT GCCCT GGCAGAAT GGCAGGGGTAAT CT GAGC C 138 

TTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTT 3077 

M I I I I I I I II I I I II I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
TTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTT 7 8 

T GGGAT T CAGAAAACT GCT T GT C AGAGACT GT T T ATTT TT T AT TAAAAAT AT AAGGC T T A 3137 

I | | || || | | I I I I I I I I I II II I II I I I I I I M I II I I I I I I I I I I I I I I I I I M I I I I I 

TGGGATT CAGAAAACT GCTTGTCAGAGACTGTTTATTTTTT ATT AAAAAT AT AAGGCTTA 1 8 



I I I I I 



RESULT 14 

BX112994 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
COMMENT 



BX112994 801 bp mRNA linear EST 07-FEB-2003 

BX112994 Soares placenta Nb2HP Homo sapiens cDNA clone 
IMAGp998F02225 ; IMAGE : 147841, mRNA sequence. 
BX112994 

BX112994. 1 GI: 27837970 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 801) 
Ebert,L., Heil,0., Hennig,S., 
Radelof,U., Schneider, D. and Korn,B. 
Human UnigeneSet - RZPD3 
Unpublished (2003) 
Contact: Ina Rolfs 

RZPD Deutsches Ressourcenzentrum fuer Genomf orschung GmbH 
Im Neuenheimer Feld 580, D-69120 Heidelberg, Germany 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Homo. 

Neubert,P., Partsch,E., Peters, M., 



RZPD; IMAGp998F02225. 

RZPDLIB; I.M.A.G.E. cDNA Clone Collection; 
Human UnigeneSet - RZPD3 (RZPDLIB No. 972) 
http: //www. rzpd.de/ CloneCards/cgi- 

bin/showLib.pl.cgi/response?libNo : =972 Contact: Ina Rolfs 
RZPD Deutsches Ressourcenzentrum fuer Genomf orschung GmbH 
Heubnerweg 6, D-14059 Berlin, Germany 
Tel: +49 30 32639 101 
Fax: +49 30 32639 111 
www. rzpd.de 

This clone is available royalty-free from RZPD; 

contact RZPD (clone@rzpd.de) for further information. Seq primer: 
Ml3r, Primer sequence: TTTCACACAGGAAACAGCTATGAC . 
FEATURES Location/ Qualifiers 

source 1. .801 

/organism="Homo sapiens" 
/mol__type= ,, mRNA" 
/db_xref="taxon: 9606" 

/clone="IMAGp998F02225 ; IMAGE: 147841" 
/sex=" Female" 

/dev_stage="placenta obtained at birth (full term)" 
/lab_host="DH10B (ampicillin resistant)" 
/clone_lib="Soares placenta Nb2HP" 

/note="0rgan: placenta; Vector: pT7T3D (Pharmacia) with a 
modified polylinker; Site_l: Not I; Site_2 : Eco RI; 1st 
strand cDNA was primed with a Not I - oligo(dT) primer [5 1 
AACTGGAAGAATTCGCGGCCGCAGGAATTTTTTTTTTTTTTTTTTT 3 1 ] , 
double-stranded cDNA was ligated to Eco RI adaptors 
(Pharmacia), digested with Not I and cloned into the Not I 
and Eco RI sites of the modified pT7T3 vector. Library 
went through one round of normalization. Library 
constructed by Bento Soares and M.Fatima Bonaldo. " 

ORIGIN 

Query Match 24.7%; Score 775; DB 13; Length 8 01; 

Best Local Similarity 99.4%; Pred. No. l.le-177; 

Matches 7 97; Conservative 0; Mismatches 3; Indels 2; Gaps 2; 
Qy 2086 TGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACT 2145 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I 

D b 1 TGAAGGTCCCGTTGACC-GGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACT 59 

Qy 2146 GGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCA 2205 

| | | | || | | | I I I I I I I I I I I II I I I I II I I I I I M I I I I I I I I II M I I I I I I I M I I I I 

D b 60 GGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCA 119 

Qy 22 06 TCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGA 2265 

| M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 120 TCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGA 179 

Qy 2266 CCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGG 2325 

| | | | | | | | | | | | | || | I I I II II I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 180 CCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGG 239 

Qy 2326 AAT GC AG GAC CT CT GC CAGT GAT GT GGAC GCT GACAACAACT GCCT AGGCACT GAGGT AG 2385 

| | || | | | | | | | | | | | I I I I I I I I I I I I I I I II II I I I I I I I I t I I I I M I I I I I M I I I I 
Db 240 AAT GC AGGAC CT CT GC CAGT GAT GT GGAC G CT GACAACAACT GCCT AGGCACT GAGGTAG 299 



Qy 


2386 


Db 


o n r\ 


Qy 


2446 


Db 


q ez. r\ 


Qy 


2506 


TAT— 

Db 


/on 


Qy 


2566 


Db 


/ion 


Qy 


2 626 


Db 




Qy 


2686 


Db 


600 


Qy 


2746 


Db 


a c n 

DDL) 


Qy 


2806 


Db 


720 


Qy 


2866 


Db 


780 



CTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCG 2445 

M M I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I II I I i I I I M I M I I I I II I I 

CTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCG 359 

GCC CAAGC AC AGC C C T GAC T AGGAT GACAG C AGCACAAAAGAC C AC CTTTCTCCCCT GAG 2505 

| | | || I | | | | | | i | M I I i I I I I I I I I I I I I I I I I I I I i I I M I I I I I I I I I I I I I I I I I 

GCC CAAGCACAG C C CT GACT AGGAT GAC AGC AG C ACAAAAGAC CAC CT TT CT C C C CT GAG 419 

AGGAGCTT CT GCT ACT CT GCAT CACT GAT GAC AC T CAGC AG GGT GAT G CAC AGCAGT CT G 2565 
| | | | | I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I I II I 
AGGAGCTT CT GCT ACT CT GCAT CACT GAT GAC ACT CAGC AGGGT GAT GCAC AGCAGT CT G 479 

CCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTAC 2 625 

I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTAC 539 

C C C C AGACCT G CT C C T ACAC T GAT AT T GAAGAAC CT GGAGAGGAT C CT T C AGT T CT G GC C 2685 

I I I I | | | I I I I I I I II I I I I I I I I I I I I I I I I I I M II I I I I I I I II I I I I I I 

C CC CAGAC CT GCT C CT AC ACT GAT AT T GAAGAAC CT G GAGAGGAT C CT T C AGT T C T GG CC 599 

ATT C CAGGGAC C CT C CAGAAACACAGT GTTT CAAGAGAC C CTAAAAAACCT GC CT GT C CC 2745 
| | | | | | | || | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATT C CAGGGAC C CT C CAGAAACACAGT GNT T CAAGAGAC CCTAAAAAAC CT GCCTGTCCC 659 



AGGACCCTAT GGTAATGAACACCAAACATCTAAACAATCATAT GCTAACATGCCACTCCT 28 05 

| | | | | | | | | I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I i I M I 

AGGAC C CT AT GGT AAT GAAC AC CAAAC AT CT AAACAAT CAT AT GCT AAC AT GC CACT C CT 



719 



GGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATG 28 65 

| | | M II I I I I I I M I I I I I I I I I I I I M I M I I I I I I I I I I I I I N I I I I I I I I I I I I 

GGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTNCCAGGGTCATG 779 
CA-GGGATCTGCTCCCTCCTGC 2 886 

II I I I I I I I I II I I I I MM 

CAGGGGATCTGCTCCCTNCTGC 8 01 



RESULT 15 

BQ883972 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BQ883972 912 bp mRNA linear EST 16-AUG-2002 

AGENCOURT_8 616305 NIH_MGC_113 Homo sapiens cDNA clone IMAGE : 630238 8 
5 1 , mRNA sequence. 
BQ883972 

BQ883972.1 GI: 22275980 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 912) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 
Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-r@mail . nih . gov 
Tissue Procurement: Dr. Mark Watson 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Homo. 



cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http://image.llnl.gov 
Plate: LLCM2519 row: m column: 13 
High quality sequence stop: 601. 
FEATURES Location/Qualifiers 
source 1. .912 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone-" IMAGE: 6302388" 
/lab_host="DH10B (phage-resistant ) " 
/ cl one__l ib="NI H_MGC_1 13" 

/note="Organ: spleen; Vector: pOTB7; Site_l: Xhol; Site_2 : 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRI/XhoI sites using the following 5 ! adaptor: 
GGCACGAG (G) . Library constructed by Ling Hong in the 
laboratory of Gerald M. Rubin (University of California, 
Berkeley) using ZAP-cDNA synthesis kit (Stratagene) and 
Superscript II RT (Life Technologies) . Note: this is a 
NIH_MGC Library." 

ORIGIN 

Query Match 24.5%; Score 769.8; DB 13; Length 912; 

Best Local Similarity 96.7%; Pred. No. 2.2e-176; 

Matches 840; Conservative 0; Mismatches 22; Indels 7; Gaps 5; 

1*1* GGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCC 1374 
| | M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I M II I I I I I I I I 
GGAC G CC CCT G CT GGT GAAAT CT G GC GT GGAG - AT ACACGGCT T G C AGT G GAG ACAGC C C 59 

AGGGCCTTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCC 1434 

| | I M M M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

AGGGCCTTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCC 119 
ACAAGGCT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCT GT T C C 14 94 

I I I I I I I I I I I I I I! I I II 1 I I II I M I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I 

ACAAGGCTGT GGTAAGT GGGGACAGCAGT GCT CAT CTGGT GGAAGAGAT T CAGCT GTT CC 179 
CTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAG 1554 

| | || | || I I II I I I II I I I I I I I I I I II M I I I I I I II I I I I M II I II I I I I I I I M II 

CTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAG 239 
GCTT CTC AGGAGGT GT CT GGAGGGT GCC C C GAGC CAACT GT AGT GT CT AT GAGAGC T GT G 1614 

I I I I I I I I I I! I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I N I I 



1 I M 1 ! I I I M I I I I It I I I I I I M M I II I I M I I I I 1 i 1 M I M II I i I I I I I 1 I I I I 

300 TGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTT 359 

GC CT C CT GT CT GC CC CCAAC CT GAACT CCT G GAAG CAGGACAT GGAGC GGGGGAAC C C AG 173' 
| M | | I I I I I I I I I I I I I II I I I I I II II I I I I M I I M I I I I I M I M M I I M I t I I I 



QY 


1315 


Db 


1 


Qy 


1375 


Db 


60 


Qy 


1435 


Db 


120 


Qy 


1495 


Db 


180 


Qy 


1555 


Db 


240 


Qy 


1615 


Db 


300 


Qy 


1675 


Db 


360 



Qy 1735 AGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAA 1794 

I M I I I I I I I I I I I I M I I I I I I I II ! I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I 

Db 420 AGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAA 47 9 

Q y 1795 TCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGT 1854 

I | I I I I I I I I I i II I II I I I I II I I I I I I I I I I I I II I I I I I I I 

Db 480 TCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGT 539 

Qy 1855 CAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCA 1914 

| | | | | | | | | | || I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I M I I I I I I I I I I I 

Db 540 CAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCA 599 

Qy 1915 CTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGT 1974 

I | | | | | I I I I II II II I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I M I 

Db 600 CTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGT 659 

Qy 1975 GCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGG 2034 

| M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 660 GCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGG 719 

Qy 2035 AC CAGACCCT - GGCCCTGGATCCT GAACTGGCAGGCAT - CC CCCGGGAGCATGT GAAGGT 2092 

I MINIM I II I I M I II I I I II I I I II MINI II M II I I I I I I I II II I II 

Db 720 AACAGACCCTGGGCCCTGGATCCTGAACTGGGAGGCATCCCCCCGGGAGCATGTGAAAGT 779 

Qy 2093 CCCGTTGACCAGGGTCAGTGG — TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCC 2150 

|| | | | I I I II II II I I III I II I I M I II II I I II II I I II I M I M 

Db 780 CCCGTTGACCAGGGTCCATGGGTGGGGCCGGCCTGGCTTGCCCAACAATCCTACTGGCCC 839 

Qy 2151 C — ACTTTGTCACTGTCACTGTCCTCTTT 2177 

I I I I I I I II I I I M I I I I I 

Db 840 CCACTTTGGCCACTGTTACTGGCCCCCTT 868 



Search completed: May 13, 2004, 15:34:10 
Job time : 7730 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: May 13, 2004, 07:58:58 ; Search time 12062 Seconds 

(without alignments) 
11293.911 Million cell updates/sec 

Title: US-10-015-391A-276 
Perfect score: 3143 

Sequence: 1 gggctgaggcactgagagac aaatataaggcttaaaaaaa 3143 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 3470272 seqs, 21671516995 residues 

Total number of hits satisfying chosen parameters: 6940544 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : GenEmbl : * 
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gb htg: 
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gb_om: * 
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11: 
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gb sy : 




13: 


gb_un : 
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14: 


gb_vi : 
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15: 


em ba : 


* 


16« 


em fun 


: * 


17 


em hum: * 


18 


em__in : 


* 


19 


em_mu : 


■k 


20 


; em om: 




21 


: em or: 


* 


22 


: em_ov: 


* 


23 


: em_pat 


: * 


24 


: em_ph : 




25 


: em_pl : 


* 


26 


: em_ro : 




27 


: em sts 


: * 



28: 


em 


un: * 


29: 


em 


vi : * 


30: 


em 


_htg_hum: * 


31: 


em 


htg_inv: * 


32, 


em 


htg_other : * 


33 


em 


htg mus : * 


34 


em 


htg_pln: * 


35 


em 


htg__rod: * 


36 


em 


htg_mam: * 


37 


; em_ 


htg_vrt : * 


38 


em 


sy : * 


39 


: em 


htgo_hum: * 


40 


: em 


htgo mus : * 


41 


: em 


htgo other: 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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AX697208 
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Sequence 
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3143 
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.0 


3143 
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AY358531 


AY358531 


Homo sapi 
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97 


.6 


3257 


9 


BC020974 


BC020974 


Homo sapi 


4 


3041.4 


96 


.8 


3252 


9 


AB029394 


AB029394 


Homo sapi 


5 


3035. 8 


96 


.6 


3191 


6 


BD249136 


BD249136 


27 human 


6 


2927 . 6 


93 


. 1 


3151 


9 


HSM807023 


BX640891 


Homo sapi 


7 


2682.2 


85 


.3 


2981 


6 


AX746794 


AX746794 


Sequence 


8 


2682.2 


85 


.3 


2981 


9 


AK091127 


AK091127 


Homo sapi 
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78 


.8 
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Sequence 
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6 
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Sequence 
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70 


.9 
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Sequence 
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58 


.4 
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6 
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Sequence 


13 


1834.8 


58 


.4 


1838 


6 


BD157628 


BD157628 


Primer fo 


14 


1834.8 


58 


.4 


1838 


9 


AK022349 


AK022349 


Homo sapi 


15 


1760 


56 


.0 


3159 


10 


BC025800 


BC025800 Mus muscu 


16 


1727.6 


55 


.0 


3046 


10 


MMRNASEMB 


X85991 M.musculus 


17 


1340 


42 


.6 


164168 


9 


AL135927 


AL135927 


Human DNA 


18 


1340 


42 


.6 


164179 


9 


AC007227 


AC007227 


Homo sapi 


19 


696.6 


22 


.2 


775 


6 


AX866805 


AX866805 


Sequence 


20 


696.6 


22 


.2 


775 


6 


BD146867 


BD146867 


Primer fo 


21 


498 


15 


.8 


567 


6 


AX872305 


AX872305 


Sequence 


22 


498 


15 


. 8 


567 


6 


BD152367 


BD152367 


Primer fo 


23 


494 


15 


.7 


1223 


6 


AX704742 


AX704742 


Sequence 


24 


486.6 


15 


.5 


184850 


2 


AC102388 


AC102388 


Mus muscu 


25 


486.6 


15 


.5 


249206 


2 


AC145168 


AC145168 


Mus muscu 


26 


470 


15 


.0 


988 


6 


AX430331 


AX430331 


Sequence 


27 


439.6 


14 


.0 


230635 


2 


AC128319 


AC128319 


Rattus no 


28 


439.6 


14 


.0 


246036 


2 


AC097816 


AC097816 


Rattus no 


29 


439.6 


14 


.0 


289877 


2 


AC119762 


AC119762 


Rattus no 


30 


327 


10 


.4 


2405 


6 


AX879101 


AX879101 


Sequence 


31 


327 


10 


.4 


2405 


6 


BD157650 


BD157650 


Primer fo 


32 


327 


10 


.4 


2405 


9 


AK022416 


AK022416 


Homo sapi 


33 


280.4 


8 


.9 


106784 


2 


AC136250 


AC136250 


Rattus no 



34 


263 


.6 


8 


. 4 


3766 


6 


BD171175 


BD171175 


Novel gen 


35 


263 


. 6 


8 


.4 


3766 


6 


BD183514 


BD183514 


Novel gen 


36 


263 


♦ 6 


8 


.4 


3766 


9 


AB051532 


AB051532 


Homo sapi 


37 


263 


. 6 


8 


.4 


3781 


6 


AX376386 


AX376386 


Sequence 


38 


263 


. 6 


8 


. 4 


3781 


6 


AX697184 


AX697184 


Sequence 


39 


263 


. 6 


8 


.4 


3781 


9 


AY358392 


AY358392 


Homo sapi 


40 


263 


. 6 


8 


.4 


3807 


9 


AY445887 


AY445887 


Homo sapi 


41 


251 


.6 


8 


.0 


3528 


9 


AK026108 


AK026108 


Homo sapi 


42 


246 


.6 


7 


.8 


2390 


6 


AX418422 


AX418422 


Sequence 


43 


237 


.8 


7 


.6 


3293 


6 


AX174731 


AX174731 


Sequence 


44 


236 


.6 


7 


.5 


2155 


6 


AX060303 


AX060303 


Sequence 


45 


236 


.6 


7 


.5 


2156 


6 


AX060313 


AX060313 


Sequence 



ALIGNMENTS 



RESULT 1 
AX697208 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 

FEATURES 

source 



AX697208 



3143 bp 



DNA 



linear PAT 02-APR-2003 



Sequence 276 from Patent WO0078961. 
AX697208 

AX697208.1 GI:29498147 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Horninidae; Homo. 

1 

Ferrara,N., Stewart, T .A. , Williams , P .M. , Baker, K. P., Desnoyers , L . , 
Eaton, D.L., Gao,W.Q., Pan, J., Botstein,D., Fong,S., Goddard, A. , 
Godowski, P . J. , Gurney,A.L., Smith, V., Tumas,D., Wood, W. I., 
Grimaldi, C . J. , Hillan,K.J., Paoni,N.F., Roy,M. A. and Watanabe, C . K. 
Secreted and transmembrane polypeptides and nucleic acids encoding 
the same 

Patent: WO 0078961-A 276 28-DEC-2000; 
Genentech Inc. (US) 

Location/Qualifiers 

1. .3143 

/organisrn= f, Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 100.0%; Score 3143; DB 6; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 

Db 

Qy 

Db 



1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 

I I II i I i I I I I II I I I I I I I I I I! I I II I I I I I I I I I I I I I I II I M I I I I I I I II I I I I 

1 GGGCT GAGGC ACT GAGAGAC C G GAAAGC CT GGCAT T C C AGAGGGAG GGAAAC GC AGCG G C 



61 



61 



ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 

I || | | | | | | | | I I I I M I I I I I I I I I I I II I I I I I II I I I I I I I I II I I I I I I I I II I I I 

ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 



60 



60 



120 



120 



Qy 



121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


121 


TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 


180 


Qy 


181 


TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 


240 




I || I I I t I 1 1 II II 1 1 I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M M II 1 II 1 II 1 I 1 1 




Db 


181 


T GC C GAC GAC GAC C GCG GG GG GAG GC GGG C AGG GGC C CAT GC C CAGG GT CAGAT ACT AT G 


240 


Qy 


241 


CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 


300 




• •■ i i t i i ■ i l i i i t i i t 1 1 i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 { 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 > t 
| | | | | | || | | | | | I 1 | | I I | 1 1 1 1 1 I 1 1 l l l l II 1 l l l 1 1 M 1 1 1 l 1 1 l l l 1 1 M l 1 1 1 1 




Db 


241 


CAGGGGAT GAAC GT AGGGC ACT T AGCTT CT T CCAC CAGAAGG GC CT C C AGGAT T TT GACA 


300 


Qy 


301 


CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 


360 




. t t i r i i 1 t t I 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 L 1 1 1 t 1 1 [ 1 I 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 


360 


Qy 


361 


C CT T G GAT AT C CAG GAT C CAG GGGT C C C CAGGCTAAAGAACAT GAT AC C GT GG C C AGC CA 


420 




I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


C CT T GGAT AT C C AGGAT C C AGGGGT C C C CAG GCT AAAGAACAT GAT AC C GT GGC CAGC CA 


420 


Qy 


421 


GTGACAGAAAAAAGAGTGAATGTGCCTTTAAGAAGAAGAGCAATGAGACACAGT GTTT CA 


480 




| | | I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


421 


GT GACAGAAAAAAGAGT GAAT GTGCCTTTAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 


480 


Qy 


481 


ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 


540 




I I 1 1 1 1 M I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


481 


ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 


540 


Qy 


541 


CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 


600 




iiitii«*ii4illlllllllllllllllllllllllllllllllll 

| | | | | | | | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 


600 


Qy 


601 


AGGACAAGGT CAT GGAGG GAAAAGGC CAAAGCC C CT T T GACC CC GCT CACAAGC AT AC GG 


660 




I | | || M 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


601 


AGGACAAGGT CAT GGAGGGAAAAGGC CAAAGCCCCTTT GACCCCGCT CACAAGCATAC GG 


660 


Qy 


661 


CTGTCTTGGT GGAT GGGAT GCT CTATTCTGGTACTATGAACAACTTCCTGGGCAGT GAG C 


720 




■ ■■■Ittlltllllllltllftllllllllllllllllllllllllllll 

| | | | | | | | | | | | | | | | | | 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


CT GT CTT GGT GGAT GGGAT GCT CT ATT CT GGTACT AT GAACAACTT CCT GGGCAGT GAGC 


720 


Qy 


721 


CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 


780 




ti*iiiiaillt*lllllftlllllllllftlttlllllllll ■ ■ ■ lilt II 

| | | | | | | M | | M 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


CCAT C CT GAT GCGCACACT GGGAT C C C AGC C T GT C CT CAAGAC C GACAACT TCCTCCGCT 


780 


Qy 


781 


GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 


840 




I I I I I || 1 1 1 1 1 1 II 1 II II 1 1 1 1 1 1 1 1 1 II II 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M II 1 




Db 


781 


GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 


840 


Qy 


841 


TCTT CGAGGAGACAGCCAGCGAGTTT GACTT CTTT GAGAGGCT CCACACAT CGC GGGT GG 


900 




i ■ ■ i ■ ■ > i i i i i i i i i i i i i t i i i i i i i i t i i i i 

1 I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


841 


T CTT CGAG GAGAC AG C CAGC GAGT T T GACTT CT T T GAGAGGCT C C AC AC AT C GC GGGT GG 


900 


Qy 


901 


CTAGAGT CT GCAAGAAT GACGT GGGCGGCGAAAAGCTGCT GCAGAAGAAGT GGACCACCT 


960 


Db 


901 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTAGAGT CT GCAAGAAT GAC GT GGGC GGC GAAAAG CT GCT GCAGAAGAAGT G GAC C AC CT 


960 


Qy 


961 


TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 


1020 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 



Db 


961 


TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 


1020 


Qy 


1021 


ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 


1080 






I 1 1 1 1 1 1 M 1 1 I 1 1 M 1 ! 1 1 1 i 1 M 1 1 1 1 1 1 1 1 M 1 I i 1 1 1 ! I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1021 


ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 


1080 


Qv 


1081 


CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 


1140 




I | | | I I I 1 I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1081 


CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 


1140 


Qv 


1141 


T T GAAC GT GT CT T T AAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T C AC GCT GGACT A 


1200 




1 | I I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 it 1 1 1 1 1 1 1 1 1 1 1 i 1 1 




Db 


1141 


TT GAACGT GT CT TTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CAC GCTGGACT A 


1200 


Qv 


1201 


CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 


1260 




I || | | M || | | | | I I 1 1 1 1 1 1 i 1 II 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1201 


CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 


1260 


Ov 


1261 


AT AAGGC CCT GAC CT T CAT GAAGGAC CAT T T C CT GAT GGAT GAGCAAGT GGT GGGGAC GC 


1320 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 




Db 


1261 


AT AAGGC C CT GAC CT T CAT GAAGGAC CATT T CCT GAT GGAT GAGCAAGT GGT GGGGAC G C 


1320 


Ov 


1321 


CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 


1380 




1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 


1380 


Ov 


1381 


T T GAT GGGCACAG C C AT CTT GT CAT GT AC CT GGGAAC CAC CACAGGGT C GC T C CACAAG G 


1440 




I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 


1440 


Ov 


1441 


CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 


1500 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 




Db 


1441 


CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 


1500 


Ov 


1501 


CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 


1560 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1501 


CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 


1560 


Ov 


1561 


CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 


1620 




1 1 1 1 II II 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II II 1 1 1 1 1 1 M 1 1 




Db 


1561 


CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 


1620 


Qv 


1621 


GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 


1680 




1 I I I I I I I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1621 


GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 


1680 


Qv 


1681 


T GT CT GCC CC CAACCT GAAC T C CT GGAAG C AG GAC AT GGAGCGGGGGAACC CAGAGT GG G 


1740 




1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1681 


TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 


1740 


Qv 


1741 


CAT GT G C CAGT GGC CC CAT GAGCAGGAGC CT T C GGC CTC AGAG CC GC CC GCAAAT CAT T A 


1800 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 II 1 1 1 1 




Db 


1741 


CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 


1800 


Qy 


1801 


AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 


1860 






1 M I I I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 It 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 




Db 


1801 


AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 


1860 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 
Qy 

Db 



18 61 TGGCCTCT T ATT AT T GGAGT CAT G GC C C AGC AGCAGT C C CAGAAGC CT CT T C CAC T GT CT 192 0 

I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 

18 61 TGGCCTCT T ATT AT T GGAGT CAT G GC C C AGC AG C AGT C C CAGAAG C C T CT T C CAC T GT CT 192 0 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

II I I i I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

1981 C AACT GAGAAT G GCT TT T CAT ACC CT GT GAT CT C CTACT GGGT GGAC AGC CAGGAC C AGA 2040 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAACT GAGAAT G GCT T T T CAT AC C CT GT GAT CT C CTACT GGGT GGACAGC CAGGAC CAGA 2040 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I 
2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

2281 AG AAG G C C C C GT T AAG C AGAG AG C AAC AC C T C C AGT C T C C C AAG G AAT G C AG G AC C T C T G 2340 

I I I 1 I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 AGAAGGC C C C GT TAAGCAGAGAGCAACAC CT C C AGT CT CC CAAGGAAT GCAGGAC CT C T G 234 0 

2341 CCAGT GAT GT GGAC GCT GACAACAACT GCCTAGGCACT GAGGTAGCTTAAACT CTAGGCA 2400 

I | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 
2341 CCAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT GAGGTAGCTTAAACT CTAGGCA 2400 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

24 61 T GACT AGGAT GACAGCAGCACAAAAGACC AC CT T T CT C CC CT GAGAG GAGCT T CT GCT AC 2520 

I I I I I I I I ! I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I 

2461 T GACT AGGAT GACAGCAGCACAAAAGACCAC CTTTCTCCCCTGAGAGGAGCTT CT GCT AC 2520 
2521 T CT GC AT C ACT GAT GACAC T C AGCAGG GT GAT GC ACAG C AGT CT GCCT CC C CT AT GGGAC 2580 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

2521 T CT GCAT CACTGAT GACACT CAGCAGGGT GAT GCACAGCAGT CTGCCT CCCCTAT GGGAC 2580 
2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

2581 TCCCTTCTACCAAGCACAT GAGCT CTCTAACAGGGTGGGGGCTACCCCCAGACCT GCT CC 264 0 

2641 TACACT GATATT GAAGAACCTGGAGAGGATC CTT CAGTTCT GGCCATT CCAGGGACCCT C 2700 

I II I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I i I I I I I I I I I I I I I I I 
2641 TACACT GAT AT T GAAGAAC CT GGAGAGGAT C CT T CAGT T CT GGC CAT T CC AG GGAC C CT C 2700 



Qy 2701 CAGAAAC ACAGT GT T T CAAGAGAC CCT AAAAAAC CTGCCTGTCC C AG GACC CT AT GGT AA 2760 

I I I I I 1 I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I !! I I I 1 I I I I I I I I I I I I I I I I I I I 

Db 27 01 CAGAAAC ACAGT GT T T CAAGAGAC C C T AAAAAAC CTGCCTGTCC CAG GACC CT AT GGTAA 2760 

Qy 27 61 TGAACACCAAACAT CTAAACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCT G 2820 

I I I I I I I I I I I I 11 I I I I I I I I I I I 1 I I I I I I I I I I II II 1 I I I I I I I I I I II I I I I I I I 
Db 27 61 T GAACAC C AAAC AT CT AAACAAT CAT AT GCT AACAT G C C ACT C CT GGAAACT C CACT CT G 2820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I ! I I I I I I I I I I I I I I 

Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

I I I I M I II I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I M I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3 060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAAT ATAAG G CT TAAAAAAA 3143 

I I I I I I I I I I I I I I I I II I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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/locus__tag= M UNQ783" 

/note="PR01317" 

/codon_start=l 

/product="semaphorin B" 

/protein_id="AAQ88895. 1" 

/db_xref ="GI : 37182185" 

/translation="MALPALGLDPWSLLGLFLFQLLQLLLPTTTAGGGGQGPMPRVRY 
YAGDERRALSFFHQKGLQDFDTLLLSGDGNTLYVGAREAILALDIQDPGVPRLKNMIP 
WPASDRKKSECAFKKKSNETQCFNFIRVLVSYNVTHLYTCGTFAFSPACTFIELQDSY 
LLPISEDKVMEGKGQSPFDPAHKHTAVLVDGMLYSGTMNNFLGSEPILMRTLGSQPVL 
KTDNFLRWLHHDASFVAAIPSTQWYFFFEETASEFDFFERLHTSRVARVCKNDVGGE 
KLLQKKWTTFLKAQLLCTQPGQLPFNVI RHAVLLPADSPTAPHIYAVFTSQWQVGGTR 
SSAVCAFSLLDIERVFKGKYKELNKETSRWTTYRGPETNPRPGSCSVGPSSDKALTFM 
KDHFLMDEQWGTPLLVKSGVEYTRLAVETAQGLDGHSHLVMYLGTTTGSLHKAWSG 
DSSAHLVEEIQLFPDPEPVRNLQLAPTQGAVFVGFSGGWRVPRANCSVYESCVDCVL 
ARDPHCAWDPESRTCCLLSAPNLNSWKQDMERGNPEWACASGPMSRSLRPQSRPQIIK 
EVLAVPNSILELPCPHLSALASYYWSHGPAAVPEASSTVYNGSLLLIVQDGVGGLYQC 
WATENGFSYPVISYWDSQDQTLALDPELAGIPREHVKVPLTRVSGG7\ALAAQQSYWP 
HFVTVTVLFALVLSGALIILVASPLRALRARGKVQGCETLRPGEKAPLSREQHLQSPK 
ECRTSASDVDADNNCLGTEVA" 

ORIGIN 



Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


i 


GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 


60 




1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 




Db 


i 


GGGCT GAGGC ACT GAGAGAC C GGAAAGC CT GGC AT T C CAGAGGGAG G GAAACGCAGC GG C 


60 


Qy 


61 


ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 


120 






1 [ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 II 1 1 1 1 1 1 1 i 1 1 1 1 II 1 1 




Db 


61 


ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 


120 


Qy 


121 


TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 


180 


Qy 


181 


TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 


240 






1 1 1 1 1 1 1 1 1 II 1 It 1 1 1 1 1 1 1 II II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 





Db 



181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 



Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

1 1 1 1 1 1 mi I M 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 i ii i 1 1 1 1 M ti 1 1 1 1 1 1 1 1 1 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CTT GGATATCCAGGAT C CAGGGGTCCCCAGGCTAAAGAACAT GATACCGTGGCCAGC CA 420 

I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 C CT T GGAT AT C CAGGAT C C AGGGGT C C C C AGGCT AAAGAAC AT GAT AC C GT G GCC AGC CA 42 0 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT G C CT TTAAGAAGAAGAGCAAT GAGAC AC AGT GT T T CA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 421 GT GAC AGAAAAAAGAGT GAAT GT G C CT TTAAGAAGAAGAGCAAT GAGAC AC AGT GT T T CA 4 80 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGT^ACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AGGACAAGGT CAT GGAGGGAAAAGGC CAAAGC CC CTT T GACC C C GCT C ACAAGCAT AC G G 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

Qy 841 T CTT CGAGGAGACAGCCAGCGAGTTTGACTTCTTT GAGAGGCT CCACACAT CGCGGGT GG 900 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 841 T CT T C GAGGAGAC AGC CAGC GAGT T T GAC T T CTT T GAGAGGCT C C AC AC AT CGCGGGTGG 900 

Qy 901 CTAGAGTCT GCAAGAAT GACGT GGGCGGCGAAAAGCT GCT GCAGAAGAAGT GGACCAC CT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CTAGAGT CTGCAAGAAT GACGT GGGC GGCGAAAAGCTGCT GCAGAAGAAGT GGAC CACCT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I 
1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

1141 T T GAAC GT GT CT T TAAGG G GAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GC T GGAC T A 1200 

I | | | | | | | | | I | I I I I I I i I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T T GAAC GT GT CT T TAAGG GGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GC T GGAC T A 1200 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M 
1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

1261 ATAAGGC C C T GAC CT T CAT GAAGGAC CAT T T C CT GAT GGAT GAG CAAGT GGT G G GGAC GC 1320 

I I I I I I I I II I I I I I I 1 I I I I I I I I 1 I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I II 
1261 AT AAGGC C CT GAC CTT CAT GAAGGAC CAT T T C CT GAT GGAT GAG CAAGT GGT G G GGAC GC 1320 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

1381 TT GAT GGGCACAGCCATCTT GT CAT GTACCT GGGAACCACCACAGGGTCGCTCCACAAGG 1440 

I | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 
1381 T T GAT GGGC AC AGC C AT CTT GT CAT GT AC CT GG GAAC CAC CACAGGGT C GC T C C ACAAG G 1440 

1441 CT GT GGT AAGT GGGGAC AGC AGT G CT CAT C T GGT GGAAGAGAT T CAGCT GT T C CC T GAC C 1500 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I 
1441 CT GT G GT AAGT GGGGAC AGCAGT GCT CAT C T G GT GGAAGAGAT T CAGCT GT T C C C T GAC C 1500 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 CAGGAGGT GT CT GGAGGGT GCCCC GAGCCAACT GT AGT GT CTAT GAGAGCT GT GT GGACT 1620 

I I I I I I I I I I I I I I I I II I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 CAGGAGGT GTCT GGAGGGT GCCCC GAGCCAACTGTAGTGT CTAT GAGAGCT GTGT GGACT 1620 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

1681 T GT CT GC C CC CAAC CT GAACTC CT GGAAGCAGGAC AT GGAG CGGG GGAACC CAGAGT GGG 174 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 T GT CT GC C C C CAAC CT GAACT C CT GGAAG CAG GAC AT GGAGC GGG GGAAC C CAGAGT GGG 1740 

1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I I I I I I II I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 CAT GT GC C AGT G GC CC C AT GAGCAGGAGC C TTCGGCCT C AGAGCC GC CC GCAAAT CAT T A 18 00 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I 
1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 



Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

I II I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I 1 I I I I I I I I 1 I I I I I I I I I I I I I I II 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAACT GAGAAT GGCTTTT CAT ACCCT GT GAT CT CCT ACT GGGT GGACAGCCAGGACCAGA 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I 

Db 1981 CAACT GAGAAT GGCTTTT C AT ACC CT GT GAT CT C CT ACT GGGT GGACAG CC AG GACCAGA 2040 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 22 81 AGAAGGC C C C GT TAAGC AGAGAGCAACACCT C CAGT CT CC CAAGGAAT GCAGGAC CT CT G 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I 

Db 2281 AGAAGGC CC C GT TAAGC AGAGAGCAACACCT C CAGT CT C C CAAGGAATGCAGGAC CT CT G 234 0 

Qy 2341 CCAGT GAT GT GGACGCT GACAACAACTGCCT AGGCACT GAGGT AGCTTAAACT CTAGGCA 2400 

I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I i I I I I I I I I I I I I I I I I I I I II I I I 
Db 2341 CCAGT GAT GT GGACGCT GACAACAACTGCCT AGGCACT GAGGT AGCT TAAACT CTAGGCA 2400 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I I I I 
Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2461 T GACTAGGAT GACAGCAGCACAAAAGAC CACCTTTCTCCC CTGAGAGGAGCTT CT GCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I 
Db 2461 T GACTAGGAT GACAGCAGCACAAAAGAC CACCTTT CT CC CCT GAGAGGAGCTT CT GCTAC 2520 

Qy 2521 T CT GCAT CACT GAT GACACT CAGC AGGGT GAT GCAC AGC AGT CT GCCT C CC CT AT GGG AC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 2521 T CT GCAT CACT GAT GACACT C AGC AG GGT GAT G CACAGC AGT C T G C CT C CC CT AT GGGAC 2 58 0 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2641 T AC AC T GAT AT T G AAG AAC C T G G AGAG GAT C C T T CAGT T C T G G C CAT T C C AG G G AC C C T C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I 
Db 2641 T AC ACT GAT AT T GAAGAAC CT G GAGAGGAT C CT T CAGT T CT GGCC AT T C C AGG GAC CC T C 2700 

Qy 2701 CAGAAAC AC AGT GT T T CAAGAGAC CCTAAAAAAC CTGCCTGTCC C AGGACC CT AT GGT AA 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 
Db 2701 CAGAAAC ACAGT GT TT CAAGAGAC C CT AAAAAAC CT GC CT GT C C C AGGACC CT AT GGTAA 27 60 

Qy 2761 T GAACAC CAAAC AT CTAAACAAT CAT AT GCT AACAT GC CACT C CT GGAAACT C CACT CT G 2820 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2761 T GAAC AC CAAAC AT CT AAACAAT CAT AT G CT AAC AT GC C ACT C CT GGAAACT C CACT C T G 2820 



Qy 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I II I I I I I I I I II I 

Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 880 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I II I 

Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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(human) 
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BC020974 3257 bp mRNA linear PRI 03-OCT-2003 

Homo sapiens hypothetical protein FLJ12287 similar to semaphorins, 
mRNA (cDNA clone MGC:9542 IMAGE: 3847802) , complete cds . 
BC020974 
BC020974, 
MGC. 
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Stapleton,M. , Scares, M. B. , Bonaldo,M.F. , Casavant, T . L. , 
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Fahey,J., Helton, E., Ketteman,M., Madan,A. , Rodrigues , S . , 
Sanchez, A., Whiting, M., Madan,A., Young,A.C, Shevchenko, Y. , 
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Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 20 Row: i Column: 24 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 21361913. 
FEATURES Location/Qualifiers 
source 1. .3257 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="MGC:9542 IMAGE: 38478 02 " 

/tissue_type= "Colon, adenocarcinoma" 

/clone_lib-"NIH_MGC_65" 

/lab_host="DH10B" 

/note="Vector: pCMV-SP0RT6" 
gene 1. .3257 

/gene="FLJl2287" 

/db_xref="LocusID: 64218" 
CDS 198. .2483 

/codon_start=l 

/product="hypothetical protein FLJ12287 similar to 
semaphorins" 

/protein_id="AAH2 0974 .1" 
/db_xref="GI: 18088093" 
/db_xref="LocusID: 64218" 

/ trans la tion="MALPALGLDPWSLLGLFLFQLLQLLLPTTTAGGGGQGPMPRVRY 
YAGDERRALSFFHQKGLQDFDTLLLSGDGNTLYVGAREAI LALDIQDPGVPRLKNMIP 
WPASDRKKSECAFKKKSNETQCFNFIRVLVSYNVTHLYTCGTFAFSPACTFIELQDSY 
LLP I S EDKVMEGKGQ S P FDPAHKHTAVLVDGMLYS GTMNN FLGS EP I LMRT LGSQPVL 
KTDNFLRWLHHDASFVAAIPSTQWYFFFEETASEFDFFERLHTSRVARVCKNDVGGE 



misc feature 



misc feature 



KLLQKKWTTFLKAQLLCTQPGQLPFNVI RHAVLLPADSPTAPHIYAVFTSQWQVGGTR 

SSAVCAFSLLDIERVFKGKYKELNKETSRWTTYRGPETNPRPGSCSVGPSSDKALTFM 

KDH FLMDEQ WGT PLLVKS GVEYT RLAVETAQGLDGHS HLVMYLGTTT GS LH KAWS G 

DSSAHLVEEIQLFPDPEPVRNLQLAPTQGAVFVGFSGGVWRVPRANCSVYESCVDCVL 

ARDPHCAWDPESRTCCLLSAPNLNSWKQDMERGNPEWACASGPMSRSLRPQSRPQIIK 

EVLAVPNSILELPCPHLSALASYYWSHGPAAVPEASSTVYNGSLLLIVQDGVGGLYQC 

WATENGFSYPVISYWVDSQDQTLALDPELAGIPREHVKVPLTRVSGGAALAAQQSYWP 

HFWVTVLFALVLSGALIILVASPLRALRARGKVQGCETLRPGEKAPLSREQHLQSPK 

ECRTSASDVDADNNCLGTEVA" 

387. .1631 

/note="Sema; Region: Sema domain. The Sema domain occurs 
in semaphorins, which are a large family of secreted and 
transmembrane proteins, some of which function as 
repellent signals during axon guidance. Sema domains also 
occur in the hepatocyte growth factor receptor" 
/db_xref="CDD:pfam01403" 
1683. .1817 

/note="PSI; Region: domain found in Plexins, Semaphorins 

and Integrins" 

/db xref="CDD:smart00423" 



ORIGIN 



Query Match 97.6%; Score 3068.4; DB 9; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 3069; Conservative 0; Mismatches 1; 



Length 3257; 



Indels 



0; Gaps 



0; 



Qy 

Db 



74 AGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCC 133 
I II I I I I I I I I I I I II I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
167 AGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCC 226 



Qy 



Db 



134 CTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGAC 193 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
227 CTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGAC 2 8 6 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



194 CGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACG 253 

I I I I I I II I I I I I I I I I I I I I i I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

287 CGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACG 346 

254 TAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAG 313 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

347 T AG GGC AC TT AGCT T CT T C CAC CAGAAG GGC CT C C AGGAT T T T GACACT CT GC T C CT GAG 406 

314 T G GT GAT G GAAAT ACT CT CT AC GT GGGGGCT C GAGAAGC C ATT CT GGCCT T GGAT AT C C A 373 

I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

407 T G GTGAT G GAAAT ACT CT CT AC GT GGGGGCT C GAGAAGC CAT T CT GGC CTT GGAT AT C C A 466 

374 GGATCCAGGGGT CCCCAGGCTAAAGAACAT GAT AC C GT GGCCAGCCAGT GACAGAAAAAA 433 

I I I II I I I I I I I I II I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

467 GGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCAGTGACAGAAAAAA 52 6 



Qy 

Db 

Qy 

Db 



434 GAGT GAAT GT GC CT T TAAGAAGAAGAGCAAT GAGACACAGT GTT T CAACT T CAT C C GT GT 493 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

527 GAGT GAAT GT GC CTT TAAGAAGAAGAGCAAT GAGACACAGT GT T T CAACT T CAT C C GT GT 586 

494 CCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGC 553 

I I I I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

587 CCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGC 646 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



554 



647 



614 



707 



674 



767 



734 



827 



794 



887 



854 



947 



T T GT AC CT T C ATT GAAC TT CAAGATT C CT AC CT GT T GC C CAT C T C GGAG GACAAGGT C AT 
I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I M I I I I I I 
T T GT AC CT T C ATT GAAC T T CAAGATT C CT AC CT GT T GC C CAT CT C GGAG GACAAG GT CAT 



613 



706 



673 



GGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGA 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGA 7 66 



T GGGAT GC T CT AT T CT G GT ACT AT GAACAACT T C CT GG G C AGT GAGC C CAT C CT GAT G CG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCG 

C ACACT GG GAT CC C AGC CT GT C CT CAAGAC C GACAACTT C CTCCGCTGGCTG CAT CAT GA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i II I I I I I I I I 
C AC ACT GGGAT C C C AGC CT GT C CT CAAGAC C GACAACTT C CTCCGCTGGCTG CAT CAT GA 

CGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGAC 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
CGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGAC 



733 



826 



793 



886 



853 



946 



913 



AGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
AGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAA 1006 



914 



973 



GAAT GACGT GGGC GGC GAAAAGCT GCT GCAGAAGAAGT GGAC CAC CT T C CT GAAGG C C CA 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1007 GAAT GAC GT GGG C G GC GAAAAGCT GCT GCAGAAGAAGT GGAC CAC CT T CCT GAAGGC C C A 1066 

974 GCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCT 1033 
I I I I I I I I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1067 GCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCT 1126 

1034 CCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGT 1093 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I 
1127 CCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGT 1186 

1094 TGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTT 1153 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1187 TGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTT 124 6 

1154 TAAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTACTTATAGGGGCCC 1213 

I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1247 TAAGGG GAAAT ACAAAGAGTT GAACAAAGAAACTT CAC GC T GGAC TACT TAT AGGGGC C C 1306 

1214 TGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGAC 1273 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1307 TGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGAC 1366 

1274 CTT CAT GAAGGAC C ATTT C CT GAT GGAT GAGC AAGT GGT GGGGAC GC CCCT GCT G GT GAA 1333 

I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1367 CTT CAT GAAGGAC CAT T T C CT GAT G GAT GAGCAAGT GGT GGGGAC GC C CCT GCT G GT GAA 142 6 

1334 ATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAG 13 93 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1427 ATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAG 14 86 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1394 C CAT CTT GT CAT GT AC C T G GGAAC CAC C AC AG GGT C GCT C CACAAGGCT GT GGT AAGT G G 1453 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I i I I I I I I I I I I I I I I I I I I I I I I I 
1487 CCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGG 154 6 

1454 GGACAGCAGTGCT CAT CT GGT GGAAGAGATTCAGCT GTTCCCT GACCCT GAACCT GTT C G 1513 

I I I I I 1 1 I I I I I I I I I I I I I I I 1 1 I 1 1 1 1 I I I I I I I 1 1 1 I I 1 1 1 1 I I I II I I I i I I 1 1 I I 

1547 GGACAGC AGT GCT CAT CT GGT G GAAGAGAT T C AG CT GT T C C CT GAC C CT GAAC CT GT T C G 1606 

1514 CAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTG 1573 

I I I I I I I I I I II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1607 CAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTG 1666 

1574 GAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCG 1633 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1667 GAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCG 172 6 

1634 GGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAA 1693 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I 
1727 GGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAA 17 86 

1694 C CT GAACT C CT GGAAGC AGGACAT G GAG CG GG GGAAC C C AGAGT GGGCAT GTG CC AGT GG 1753 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1787 C CT GAACT C CT GGAAGC AGGACAT GGAG CG GG GGAAC C C AGAGT G G GCAT GT G CC AGT GG 184 6 

1754 C CC CAT GAGCAGGAGC CT T C GGCCT CAGAGC C GC C C GCAAAT CAT TAAAGAAGT C CT GGC 1813 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1847 C CC CAT GAGCAGGAGC C T T C GGC CT CAGAG C C GC C C GCAAAT CAT TAAAGAAGT C CT GGC 1906 

1814 TGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTA 1873 

I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1907 TGTCCCTAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTA 1966 

1874 T T GGAGT CAT GGC CCAGC AGCAGT C C CAGAAG CCT CTT CCACT GT CTACAAT GGCT C C CT 1933 

I I I I I I I I I I I I I II 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1967 TT GGAGT CAT GGCCCAGCAGCAGTCCCAGAAGCCT CTT CCACT GT CTACAAT GGCT CCCT 2026 

1934 CTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGG 1993 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2027 CTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGG 2 086 

1994 CTTTT CATACCCT GT GATCT CCTACT GGGT GGACAGCCAGGACCAGACC CT GGCCCT GGA 2053 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
2087 CTTTT CAT ACCCTGT GATCT CCTACT GGGT GGACAGC CAGGACCAGACCCT GGCCCT GGA 214 6 

2054 TCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGG 2113 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
2147 T CCT GAACT G GC AGGC AT C C C C C G GGAGCAT GT GAAG GT C C C GT T GACCAG GGT C AGT GG 2206 

2114 TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCT 2173 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2207 TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCT 22 66 

2174 CTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACT 2233 

I I I II I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I 

2267 CTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACT 2326 

2234 CCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTT 2293 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I 1 1 I I I II I I I I I I I I I I I I I I I I I 

2327 CCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTT 238 6 

22 94 AAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTGCCAGTGATGTGGA 2353 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I 
2387 AAG CAGAGAGCAACAC CT C C AGT CT C C CAAGGAAT GCAGGAC CT CT GCCAGT GAT GT GGA 244 6 

2354 CGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTG 2413 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2447 CGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTG 2506 

2414 CGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGAC 2473 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2507 CGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGAC 2566 

2474 AGCAGCACAi^AAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGA 2533 

I I I I I I I I I I I I I I I II I I II I I II I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I II 
AGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGA 2 626 



2567 



2593 



2534 TGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2627 TGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAA 268 6 

2594 GCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTG 2653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
2687 GC ACAT GAG C T CT CTAAC AGGGT GGG GG CT AC C C C CAGAC CT GCT CC T ACACT GAT AT T G 274 6 

2654 AAGAAC CT GGAGAGGAT CCTT CAGTT CT GGC CATT CCAGGGACCCT CCAGAAACACAGT G 2713 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I II I 1 I II I I 
2747 AAGAAC CT G GAGAGGAT CCTT C AGTT CT GGC CAT T C CAGG GACCCT C CAGAAACACAGT G 28 06 

2714 T T T CAAGAGAC C CTAAAAAACCT GCCT GT C C CAGGAC C CT AT GGTAAT GAACAC CAAAC A 2773 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2807 T T T CAAGAGAC C CTAAAAAACCT G CCT GT C C CAG GAC C CT AT GGTAAT GAACAC CAAAC A 28 66 

2774 TCTAAACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTT 2833 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II I I I 
2867 TCTAAACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTT 2926 

2834 GGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTT 2893 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2927 GGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTT 298 6 

28 94 ACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCT 2953 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2987 ACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCT 3046 

2954 TGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTG 3013 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

3047 TGCTT CAGTT GGGGCAGACTCT GAT CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTG 3106 

3014 AGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTT 3073 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
3107 AGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTT 3166 



3074 GT T T T GGGAT T C AGAAAACT GCTT GT CAGAGACT GT TT AT T T TT T AT TAAAAAT AT AAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 



3133 



Db 



3167 GT T T T GGGAT T C AGAAAACT G CT T GT CAGAGACT GT T T AT TT TT T AT T AAAAAT ATAAGG 322 6 



Qy 3134 CTTAAAAAAA 3143 

I I I I I 1 I I I I 
Db 3227 CTTAAAAAAA 3236 
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AB029394 

AB029394.1 GI:12248381 
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Homo sapiens (human) 
Homo sapiens 
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Location/Qualifiers 

1. .3252 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

1. .3252 

/gene="SEMB" 

209. .2497 

/gene="SEMB" 

/codon_start=l 

/product="SEMB" 

/protein_id="BAB20087 . 1" 

/db_xref="GI: 12248382" 

/translation="MALPALGLDPWSLLGLFLFQLLQLLLPTTTAGGGGQGPMPRVRY 
YAGDERRALSFFHQKGLQDFDTLLLSGDGNTLYVGAREAILALDIQDPGVPRLKNMIP 
WPASDRKKSECAFKKKSNETQCFNFIRVLVSYNVTHLYTCGTFAFSPACTFIELQDSY 
LLPISEDKVMEGKGQSPFDPAHKHTAVLVDGMLYSGTMNNFLGSEPILMRTLGSQPVL 
KTDNFLRWLHHDASFVAAIPSTQWTFFFEETASEFDFFERLHTSRVARVCKNDVGGE 
KLLQKKWTTFLKAQLLSAPSRGSCPSTSSATRSCSPPILPQLPTSTQSSPPSGQVGGT 
RSSAVCAFSLLDIERVFKGKFKELNKETSRWTTYRGPETNPRPGSCSVGPSSDKALTF 
MKDHFLMDEQWGTPLLVKSGVEYTRLAVETAQGLDGHSHLVMYLGTTTGSLHKAWS 
GDSSAHLVEEIQLFPDPEPVRNLQLAPTQGAVFVGFSGGVWRVPRANCSVYESCVDCV 
LARDPHCAWDPESRTCCLLSAPNLNSWKQDMERGNPEWACASGPMSRSLRPQSRPQII 
KEVLAVPNSILELPCPHLSALASYYWSHGPAAVPEASSTVYNGSLLLIVQDGVGGLYQ 
CWAT EN G F S Y P VI S YWVD S Q DQT L AL D P E LAGI P REH VKVP LTRVS GGAALAAQ Q S YW 
PHFVTVTVLFALVLSGALIILVASPLRALRARGKVQGCETLRPGEKAPLSREQHLQSP 



ORIGIN 



KECRTSASDVDADNNCLGTEVA" 



Query Match 96.8%; Score 3041.4; DB 9; Length 3252; 

Best Local Similarity 99.4%; Pred. No. 0; 

Matches 3074; Conservative 0; Mismatches 16; Indels 3; Gaps 2; 
Qy 4 8 GAAACGCAGCGGCAT CC CCAGGCT CCAGAGCT CCCT GGT GACAGT CT GT GGCT GAGCAT G 107 

Mil Ml M I M M I M M M I M M M M M M M M M M M I 

Db 152 GAT^AGTGCCCGGGTGCCTGTTTCCCCAGACCTCCCTGGTGACAGTCTGTGGCTGAGCATG 211 

Qy 108 GCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTG 167 

M I M M M M M M M M M M I M M M M M M I M M M M M I M M M M M M 

Db 212 GCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTG 271 

Qy 168 CTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGG 227 

M M M M M M M M M M M M M M M M M M M M M M M M M I M M M M I 

Db 272 CTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGG 331 

Qy 228 GTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTC 287 

M I M M I M M M M M M M M M M M M I M M M M M M M M M M M I M M 

Db 332 GTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTC 391 

Qy 288 CAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGA 347 

M M M M M M M M M M M M M M M M M M M I M M M M M M M I M M M 

Db 392 CAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGA 451 

Qy 348 GAAGC CAT TCTGGCCTTG GAT AT C C AG GAT C C AGGGGT C C C C AGGCT AAAGAAC AT GAT A 4 07 

M M I M M I M M M M M M M M M M M M M M M M M M I M M M M M M I 

Db 452 GAAGC CAT TCTGGCCTTG GAT AT C C AGGAT C CAGGGGT C C C C AGGCT AAAGAACAT GAT A 511 

Qy 4 08 C C GT G G C C AGC C AGT GAC AGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT GAG 4 67 

M M M M M M M M M M M M M M M M I M M M M M M M M M I M M M M 

Db 512 CCGTGGCCAGCCAGT GACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT GAG 571 

Qy 4 68 AC ACAGT GT T T CAACT T CAT CCGTGTCCTGGTTTCT T ACAAT GT C AC C CAT CT CT AC AC C 527 

M M M M M M I M M M M M M M M M M M M M M M M M M M I M M M M 

Db 572 ACACAGT GT T T CAACT T CAT C C GT GT C CT GGT T T C TTACAAT GT C AC C CAT CT CT AC AC C 631 

Qy 528 TGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTG 587 

I M I M I M M M M M M M M I I M M M M M M M M M M I M M M I I M M M 

Db 632 TGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTG 691 

Qy 588 T T GC C CAT CT C GGAGGACAAGGT CAT GGAG GGAAAAGGC CAAAGC CC CT TT GAC C C C GCT 647 

M M M M M M M M M M M M M M M M M M I M M M I M M M M M M M M 

Db 692 T T GC C CAT CT C GGAGGACAAGGT CAT GGAG GGAAAAGGC CAAAGC C C CT TT GAC C C C GCT 751 

Qy 648 CACAAGCATAC GGCT GT CTT GGT GGAT GGGAT GCT CT AT T CT GGT ACT AT GAACAACTT C 7 07 

I M M M M M M M M M M M M I M M M M M M M M M M M M M M M M M 

Db 752 CACAAGCAT ACGGCT GTCTT GGT GGAT GGGAT GCT CT AT T CT GGT ACT AT GAACAACTT C 811 

Qy 708 CTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGAC 767 

M M M M M M M M M M M M M M M M M M M M M M M M I M M M I M M 

Db 812 CT GG GCAGT GAG C C CAT C CT GAT G C G C AC ACT G GGAT C C C AG C CT GT C CT CAAGAC CGAC 871 

Qy 768 AACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAG 827 

M M M M M M M M I M M M M M M M M M I M M M M M M M I M M M M I 



Db 


872 


AACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAG 


931 


Qv 


828 


GTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCAC 


887 






1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 M 1 i 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 i 




Db 


932 


GTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCAC 


991 


Qv 


888 


ACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAG 


947 




1 I I I I I I I I I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


992 


ACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAG 


1051 


Ov 


948 


AAGTGGACCACCTTCCTGAAGGCCCAGCTG — CTCTGCACCCAGCCGGGGCAGCTGCCCT 


1005 




1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1052 


AAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTCTGCACCCAGCCGGGGCAGCTGCCCT 


1111 


Ov 

vy 


1006 


TCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCT 


1065 




I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 




Db 


1112 


TCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCT 


1171 


Ov 

^y 


1066 


ACGCAGTCTTCACCTCCCAGT-GGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 


1124 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1172 


ACGCAGTCTTCACCTCCCAGTGGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 


1231 


Ov 
vy 


1125 


T T CT CT CT CT T GGACATT GAAC GT GT CT T TAAGGGGAAAT ACAAAGAGT T GAACAAAGAA 


1184 




1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 




Db 


1232 


TTCTCTCTCTT GGACATT GAAC GT GT CT T T AAGGG GAAAT T CAAAGAGT T GAACAAAGAA 


1291 


Ov 


1185 


ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 


1244 




I M | | | I I I I I I I I I I I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1292 


ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 


1351 


Ov 
>&y 


1245 


GT GGGC CC CT C CT CT GAT AAG GC C CT GAC CT T CAT GAAGGAC CAT TT C CT GAT GGAT GAG 


1304 




I I M 1 1 1 II 1 1 1 1 1 1 1 I 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


1352 


GTGGGCCCCTCCT CT GATAAGGC C CT GAC CT T CAT GAAG GAC C AT TT C CT GAT GGAT GAG 


1411 


Ov 

vy 


1305 


CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 


1364 




| || | | | I I I I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1412 


CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 


1471 


Ov 


1365 


GAGAC AGC C CAGGGCCT T GAT GGG CAC AGC C AT CTT GT CAT GT AC CT GGGAAC CAC CACA 


1424 




1 I I I I 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 i 1 1 




Db 


1472 


GAGAC AGC C CAGGGCC T T GAT GGGCAC AGC C AT CT T GT CAT GT AC CT G GGAAC CAC CACA 


1531 


Ov 
vy 


1425 


GGGT CGCT C CACAAGGCT GTGGT AAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT 


1484 




| | | | | | | | I I II I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1532 


GGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATT 


1591 


Ov 
vy 


1485 


CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 


1544 




| I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 




Db 


1592 


CAGCTGTTCCCTGACCCTG7UVCCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 


1651 


Ov 


1545 


GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 


1604 




| | | | I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1652 


GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 


1711 


Qy 


1605 


GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 


1664 




1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


1712 


GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 


1771 



Qy 1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

I I I I I I I I I I I I! I I I I I I I I I I I ! I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1772 C GAAC CTGTTGCCTCCTGTCTGC C CCCAACCT GAACT C CT G GAAGCAGGAC AT GGAGC G G 1831 

Qy 1725 GGGAACC CAGAGT GGGCAT GT GCCAGT GGC C C CAT GAGCAGGAGC CT T C GGC CT CAGAGC 1784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
Db 1832 GG GAAC C CAGAGT GG G CAT GT GC CAGT GG CC CC AT GAGCAG GAGC CT T C GGC CT C AGAG C 1891 

Qy 1785 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I i I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1892 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1951 

Qy 1845 CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1904 

I I I I I I I I I I I I I I I I I I I I I I II I I I t I I II I I I I I I I I I I I I I I I I I I I I I I I I | | I I 
Db 1952 CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 2011 

Qy 1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2012 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 2071 

Qy 1965 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2 024 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2072 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2131 

Qy 2025 GACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCAT 2084 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 
Db 2132 GACAGC CAGGAC CAGAC CCTGGCCCT GGAT C CT GAACT G GC AG GCAT CC C C C GGGAGCAT 2191 

Qy 2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2192 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2251 

Qy 2145 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 
Db 2252 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2311 

Qy 2205 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2264 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2312 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2371 

Qy 2265 AC C CT GCGCC CT GGGGAGAAGG C C CC GT T AAGCAGAGAGCAACAC CT C CAGT CT C C CAAG 2324 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2372 ACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAG 2431 

Qy 2325 GAAT GCAGGACCT CT GCCAGT GAT GT GGACGCT GACAACAACTGCCTAGGCACT GAGGTA 2384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2432 GAAT GCAGGACCT CTGCCAGTGATGT GGACGCT GACAACAACTGCCTAGGCACT GAGGTA 2491 

Qy 2385 GCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGC 2444 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2492 GCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGC 2551 

Qy 2445 GGC C CAAGC AC AGC C CT GAC T AGGAT GAC AGCAGCACAAAAGAC CAC CT TT CT C C C CT GA 2504 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2552 GGCCCAAGCACAGCCCT GACT AGGAT GAC AGCAGCACAAAAGAC CACCTTT CT CCC CT GA 2 611 



Qy 2505 GAGGAGCT T CT GCT ACT CT G CAT C ACT GAT GAC ACT CAGCAGGGT GAT GC AC AGC AGT C T 2564 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I || I I I i I I I I || | II 
Db 2 612 GAGGAG CT T CT GCT ACT CT GCAT C ACT GAT GACACT CAG CAGG GT GAT GCACAG CAGT CT 2671 

Qy 2565 GCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTA 2624 

I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I M I | | | | I | M I I I I I I I I 

Db 2672 GCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTA 2731 

Qy 2625 C C C C CAG AC C T G C T C CT AC AC T GAT AT T G AAG AAC C T G G AGAG GAT C C T T CAGT T C T G G C 2684 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I II I I I I I I I I I 
Db 2732 CCCCCAGACCTGCT CCTACACT GATATT GAAGAAC CT GGAGAGGATCCTTCAGTT CT GGC 2791 

Qy 2685 CAT T C CAG G GAC C C T C C AGAAAC AC AGT GT T T C AAGAGAC C C T AAAAAAC CTGCCTGTCC 2744 

I M I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I 
Db 27 92 CATTCCAGGGACCCTCCAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGTCC 2851 

Qy 2745 CAGGAC C CTAT GGTAAT GAACACCAAACAT CTAAAC AAT CATAT GCTAACAT GCCACT CC 2804 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2852 CAGGAC C C TAT GGTAAT GAACAC CAAAC AT CTAAAC AAT CAT AT GCT AACAT GCCACT C C 2911 

Qy 2 8 05 TGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCAT 2 8 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2 912 TGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCAT 2 971 

Qy 2865 GCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGT 2924 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I II I I I I I 

Db 2972 GCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGT 3031 

Qy 2925 CTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTC 2984 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3032 CTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTC 3091 

Qy 2985 TGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACC 3044 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 3092 TGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACC 3151 

Qy 3045 CCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAA7\ACTGCTTGTCAGAG 3104 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3152 CCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAG 3211 

Qy 3105 ACT GT T T AT TT T T TAT T AAAAAT ATAAGG CT T A 3137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3212 ACT GT T TAT T T T T TAT TAAAAAT AT AAG GCT T A 3244 
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/organism^ Homo sapiens (human) 1 . 



FEATURES 

source 



ORIGIN 



Location/Qualifiers 
1. .3191 

/organism="Homo sapiens" 
/mo l__type=" genomic DNA" 
/db xref="taxon:9606 M 



Query Match 96.6%; 
Best Local Similarity 99.7%; 
Matches 3031; Conservative 



Score 3035.8; DB 6; 
Pred. No. 0; 
9; Mismatches 1; 



Length 3191; 
Indels 0; Gaps 



0; 



Qy 

Db 



103 GCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCC 1 62 

I I I I I I I I I I I I I I I I I I I I I ! I I I I I ! I I i I I I I I I I I I I I II I I I I I I I I I II I I I I I 

78 GCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCC 137 



QY 
Db 



163 AACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGC 222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 
138 AACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGC 197 



Qy 



223 C CAGG GT CAGAT ACT AT G CAGG GGAT GAAC GT AGGGCACTT AGC T T CT T C C AC CAGAAGG 282 
I I I I I I I I I I I I I I I I I I I II ! I I I I I I I II I II I I ! I I I I I I I I I I I I I I I I | I I I I I I 



Db 



198 C C AG GGT C AGAT ACT AT GCAGG GGAT GAAC GT AGGG CACT T AGC TT CT T C CACCAGAAGG 257 



Qy 283 GCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGG 342 

I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 258 GCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGG 317 

Qy 343 CT CGAGAAGC CAT T CT GGC CTT GGAT AT CCAGGAT C CAGGGGT CC CCAGGCT AAAGAACA 402 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 318 CT CGAGAAGCCATT CT GGCCTT GGATATCCAGGATC CAGGGGTCCC CAGGCTAAAGAACA 377 

Qy 403 T GAT AC C G T G GC C AGC C AGT GAC AGAAAAAAGAGT GAAT GT G C C T T T AAGAAGAAGAG C A 4 62 

I I I I i I M I I 1 1 I I I I I I I I 1 1 I II I I 1 1 I I I I I I I I 1 1 I I I 1 1 I I I I I I I 1 1 I 1 1 I I I I 

Db 378 T GAT AC C GT GGC C AGC C AGT GACAGAAAAAAGAGT GAAT GT GCCTT T AAGAAGAAGAGCA 437 

Qy 4 63 ATGAGACACAGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCT 522 

I I I I I I I I II I I I I 11 I I I I II I I I 1 I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 438 AT GAGACACAGT GTTT CAACTT CAT CCGT GT C CT GGTT T CTT ACAAT GT CACCCAT CT CT 4 97 

Qy 523 ACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCT 582 

II I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I! I II I I I I I I I I 

Db 498 ACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCT 557 

Qy 583 AC CT GT T GC C CAT CT C GGAG GACAAGGT CAT GGAGG GAAAAG GC CAAAGC C CCT TT GACC 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 558 AC CT GT T GCC CAT CT C GGAG GACAAGGT CAT GGAGG GAAAAGGC CAAAGC C C CT TT GAC C 617 

Qy 643 CCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACA 702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I 
Db 618 CC GCT CACAAGCAT AC GGCT GT CT T G GT GGAT GGGAT G CT CT AT T CT GGT ACT AT GAAC A 677 

Qy 703 ACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGA 762 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 678 ACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGA 737 

Qy 7 63 CCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGA 822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 738 CCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGA 797 

Qy 823 C C CAGGTC GT CT ACTT CT T CTT C GAG GAGAC AGC CAGC GAGT TT GACT T CTT T GAGAGGC 882 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 798 CCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGC 857 

Qy 883 TCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGC 942 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 858 TCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGC 917 

Qy 943 AGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGC 1002 

I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I 

Db 918 AGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGC 977 

Qy 1003 CCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACA 1062 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 978 CCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACA 1037 

Qy 1063 TCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTG 1122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1038 TCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTG 1097 



Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 



1123 CCTTCTCTCTCTT GGAC AT T GAAC GT GT CT T T AAG G GGAAAT ACAAAGAGT T GAACAAAG 1182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1098 CCTTCTCTCTCTT GGAC AT T GAAC GT GT CT T T AAG G GGAAAT ACAAAGAGT T GAACAAAG 1157 

1183 AAACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCT 1242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I : I I I I I I I I I I I I 
1158 AAACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGSCAGGCAGTTGCT 1217 

1243 CAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATG 1302 

: I : I I I I I I I I I : I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I II I I I I I I I I I I I! I 
1218 YART GGG C C C CT YCT CT GATAAGG CC CT GAC C T T CAT GAAG GAC CAT T T CCT GAT GGAT G 1277 

1303 AGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAG 1362 

I I I I I I I I I I II I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1278 AGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAG 1337 

1363 T GGAGAC AGC C C AG GGC CTT GATG GGCACAGC CAT CT T GT CAT GT AC CT GG GAAC CAC C A 1422 
I I I I! II I I I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 

1338 T GGAGACAGC C C AGGG C CTT GAT GGGCACAGC CAT CTT GT CAT GT AC CT GG GAAC CAC CA 1397 

1423 CAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGA 14 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1398 CAGGGT CGCT C CACAAGGCTGT GGTAAGTGGGGACAGCAGTGCT CAT CT GGTGGAAGAGA 1457 

1483 TTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTG 1542 

I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1458 TTCAGCTGYTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTG 1517 

1543 CAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCT 1602 

I I I I I I I I I : I I I I I I I I : I I I I I I II I II I : I I I I I I I I I I I I I I I I II I I I I I I I I II 
1518 CAGTGTTTGKAGGCTTCTYAGGAGGTGTCTGRAGGGTGCCCCGAGCCAACTGTAGTGTCT 1577 

1603 ATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGT 1662 

I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I 

1578 ATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGT 1637 

1663 CCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGC 1722 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1638 CCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGC 1697 

1723 GGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGA 1782 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1698 GGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGA 1757 

1783 GCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCT 1842 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1758 GCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGCTCCCCT 1817 

1843 GCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAG 1902 

II I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 
1818 GC C C C CAC CT GT CAGC CT T GGCCT CT TATT AT T G GAGT C AT GG C C CAGC AGCAGT C CCAG 1877 

1903 AAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGG 19 62 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1878 AAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGG 1937 



Qy 1963 GTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGG 2022 

I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I 

Db 1938 GTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGG 1997 

Qy 2023 TGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGC 2082 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
Db 1998 T GGAC AG C CAGGAC C AGACC CT GGCC CT G GAT C CT GAACT GGC AG GCAT C C C C C GG GAG C 2057 

Qy 2083 ATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCT 2142 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2058 ATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCT 2117 

Qy 2143 ACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCA 2202 

I I I I I I I I I I I I I I I I I 1 I I I I I II I I I II I I I I I I I I I I I I I I I II i I I I I I I I I I I I I 
Db 2118 ACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCA 2177 

Qy 2203 TCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTG 2262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2178 TCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTG 2237 

Qy 2263 AGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCA 2322 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2238 AGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCA 2297 

Qy 2323 AGGAAT GC AG GAC CT CT GCC AGT GAT GT GGAC GC T GACAACAACT GC CT AG GC ACT GAGG 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I 

Db 22 98 AGGAAT GC AG GAC CT CT GC C AGT GAT GT GGAC GCT GACAACAACT GC CT AGGC ACT GAGG 2357 

Qy 2383 TAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGG 2442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2358 TAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGG 2417 

Qy 2443 GCGGCCCAAGCACAGCCCTGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCT 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 2418 GC GGC C CAAGC ACAGC C CT GACTAGGAT GACAGC AGCACAAAAGACC AC CT TT C T C C C CT 2477 

Qy 2503 GAGAGGAGCTT CT GCT AC T CT G CAT CACT GAT GACACT C AG CAGGGT GAT GCACAGC AGT 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2478 GAGAGGAGCT T CT G CT ACT CT GCAT CAC T GAT GACACT C AGC AGG GT GAT GC ACAG C AGT 2537 

Qy 2563 CTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGC 2 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2538 CTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGC 2597 

Qy 2623 T AC C C CC AGAC CT GCT C CT ACACT GAT AT T GAAGAAC CT GGAGAG GAT C CT T CAGT T CT G 2682 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2598 TACCCCCAGAC CT GCT CCTACACT GAT ATT GAAGAAC CT GGAGAGGATCCTTCAGTT CT G 2657 

Qy 2683 GCCATTCCAGGGACCCTCCAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGT 2742 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 
Db 2658 GC CAT T C C AGG GAC CCT C CAGAAACACAGT GT T T CAAGAGAC C CTAAAAAACC T GC CT GT 2717 

Qy 2743 C CC AGGAC C CT AT G GTAAT GAACAC CAAAC AT CTAAACAAT C AT AT GCT AACAT GC C ACT 2802 

I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I II I i I I I I I I I I I I I I I I I I II I I I I I I 

Db 2718 C C CAGGACC CT AT GGT AAT GAACAC CAAACAT CTAAACAAT CAT AT GCT AACAT GC CACT 2777 

Qy 2803 CCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTC 28 62 



Db 



I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I | | | I 
2778 CCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTC 2837 



Qy 2863 ATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAA 2 922 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I 
Db 2838 ATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAA 2897 

Qy 2923 GTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT 2982 

I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2898 GTCTTYCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT 2957 

Qy 2983 TCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGA 3042 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I II I I || || I I 
Db 2958 TCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGA 3017 

Qy 3043 CCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAG 3102 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 3018 CCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAG 3077 

Qy 3103 AGACTGTTTATTTTTTATTAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3078 AGACT GT T TAT T T TT T AT TAAAAAT AT AAGGCT TAAAAAAA 3118 
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/organism="Homo sapiens" 

/mol_type="mRNA M 

/db xref= M taxon:9606" 



/map="lq22" 

/clone="DKFZp686D04248" 
/tissue_type="human salivary gland" 

/clone_lib="686 (synonym: hlcc3) . Vector pSportlJSf i; host 

DH10B; sites SfilA + SfilB" 

/dev__stage= "adult" 
gene 1. .3151 

/gene="DKFZp686D04248" 
CDS 217. .2388 

/gene="DKFZp686D0424 8" 

/note="Semaphorin B, differentially spliced" 
/codon_start=l 

/product="hypothetical protein" 
/protein__id="CAE45942. 1" 
/db_xref="GI : 34365196" 

/ trans la tion="MPRVRYYAGDERRALSFFHQKGLQDFDTLLLSGDGNTLYVGARE 
AILALDIQDPGVPRLKNMIPWPASDRKKSECAFKKKSNETQCFNFIRVLVSYNVTHLY 
TCGTFAFSPACTFIELQDSYLLPISEDKVMEGKGQSPFDPAHKHTAVLVDGMLYSGTM 
NNFLGSEPILMRTLGSQPVLKTDNFLRWLHHDASFVAAIPSTQWYFFFEETASEFDF 
FERLHTSRVARVCKNDVGGEKLLQKKWTTFLKAQLLCTQPGQLPFNVI RHAVLLPADS 
PTAPH I YAVFT S QWQVGGTRS S AVCAFS LLD I ERVFKGKYKELNKET S RWT T YRGPET 
NPRPGSCSVGPSSDKALTFMKDHFLMDEQWGTPLLVKSGVEYTRLAVETAQGLDGHS 
HLVMYLGTTPGSLHKAWSGDSSAHLVEEIQLFPDPEPVRNLQLAPTQGAVFVGFSGG 
VWRVP RAN C S VYE S C VD C VL ARD P H C AWD PESRTCCLL S APN LN S WKQ DME RGN P EWA 
CASGPMSRSLRPQSRPQIIKEVLAVPNSILELPCPHLSALASYYWSHGPAAVPEASST 
VYNGSLLLIVQDGVGGLYQCWATENGFSYPVISYWVDSQDQTLALDPELAGIPREHVK 
VP LT RVS GGAALAAQQ S YWPH FVT VT VL FALVL S GAL 1 1 L VAS P LRAL RARGKVQ GC E 
TLRPGEKAPLSREQHLQS PKECRT SAS DVDADNNCLGTEVA" 

polyA_signal 3117. .3122 

/gene="DKFZp686D0424 8" 

polyA_site 3134 

/gene="DKFZp68 6D0424 8" 

ORIGIN 



Query Match 93.1%; Score 2927.6; DB 9; Length 3151; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 2933; Conservative 0; Mismatches 9; Indels 0; Gaps 0; 



Qy 


202 


GAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGTAGGGCAC 


261 






1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


200 


GT GGCT GAGCAT GGCCCAT GCC CAGGGT CAGATACTAT GCAGGGGAT GAAC GTAGGGCAC 


259 


Qy 


262 


TTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATG 


321 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


260 


TTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATG 


319 


Qy 


322 


GAAATACT CT CT AC GT GGGGGCTC GAGAAGCC AT TCTGGCCTTG GAT AT CC AGGAT C CAG 


381 






1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


320 


GAAATACT CT CT AC GT G GGGGCT C GAGAAGC C AT TCTGGCCTT GGAT AT CC AG GAT CCAG 


379 


Qy 


382 


GGGT CCC CAGGCTAAAGAACAT GATACCGT GGCCAGCCAGT GACAGAAAAAAGAGT GAAT 


441 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


380 


GGGT CCC CAGGCTAAAGAACAT GAT AC C GT G GC C AGC C AGT GACAGAAAAAAGAGT GAAT 


439 


Qy 


442 


GT GC CT T TAAGAAGAAGAGCAAT GAGACACAGT GT T T CAACT T CAT C CGT GT C CT GGTT T 


501 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 




Db 


440 


GT GC CT T TAAGAAGAAGAGCAAT GAGACACAGT GT T T CAACT T CAT C C GT GTC CT GGT T T 


499 



Qy 502 CTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCT 561 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 500 CTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCT 559 

Qy 562 T CAT T GAACT T CAAGATT CC T AC CT GT T G C C CAT CT C GGAGGACAAGGT CAT GGAG GGAA 621 

I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 560 T CAT T GAACT T CAAGATT CCT AC CTGTTGCC CAT C T C GGAGGACAAGGT CAT GGAGGGAA 619 

Qy 622 AAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGC 681 

I I I I II I I I I I I I I II I I I I I I II I I II I I I I I I I II I I I I I I II II I II II I I I I I I I I 

Db 62 0 AAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGC 679 

Qy 682 TCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGG 741 

II I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I i I I I I I I I I I I I I I I | | | | | 

Db 68 0 TCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGG 739 

Qy 742 GATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCT 801 

I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I I I I I 

Db 74 0 GATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCT 799 

Qy 8 02 TTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCG 8 61 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II 
Db 8 00 TTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCG 859 

Qy 862 AGT T T GACT T CT T T GAGAGGCT CC AC AC AT C GC GGGT GGCT AGAGTCT G CAAGAAT GAC G 921 

I I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I I I I II I I I | | | | | | | | | | 
Db 860 AGT T T GACT T CT T T GAGAGG CT CCAC ACAT CGCGGGTGGC T AGAGT CT GCAAGAAT GAC G 919 

Qy 922 TGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCT 981 

I I I I I I I I I I I I I I I I I I II I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 920 TGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCT 979 

Qy 982 GCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCG 1041 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 980 GCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCG 103 9 

Qy 1042 ATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGA 1101 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | I I I | | 
Db 104 0 ATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGA 1099 

Qy 1102 CCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGA 1161 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I 
Db 1100 CCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGA 1159 

Qy 1162 AAT ACAAAGAGT T GAACAAAGAAACT T C AC GCT G GACT ACT TAT AGGG GC C CT GAGAC CA 1221 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I 
Db 1160 AAT ACAAAGAGT T GAACAAAGAAACT T C AC GCT GGACT ACT T AT AGG GG CC CT GAGAC C A 1219 

Qy 1222 ACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGA 1281 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1220 ACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGA 127 9 

Qy 1282 AGGAC CAT T T C CT GAT G GAT GAGCAAGT GGT GGG GACGC C CCT G CT G GT GAAAT CT GGC G 1341 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 
Db 1280 AGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCG 1339 



Qy 1342 T G GAGT AT ACAC GGCT T GCAGT GGAGAC AGC C CAGGGC C T T GAT G GG CAC AGC C AT CT T G 14 01 

I I I I I I I I I I I I I 1 I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 134 0 T GGAGTAT ACAC GGCT T GCAGT GGAGACAGCCCAGGGCCTT GATGGGCACAGCCAT CTTG 1399 

Qy 14 02 T CAT GT AC CT GGGAAC CACCACAGGGT CGCT CCACAAGGCT GT GGTAAGTGGGGACAGCA 14 61 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1400 TCATGTACCTGGGAACCACCCCAGGGTCGCTCCAC7VAGGCTGTGGTAAGTGGGGACAGCA 1459 

Qy 14 62 GTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGC 1521 

I I I I I I I I I I M I I I II I I I I I I I II I I I I | | | | I I 1 || | | | || | | | | | | || | | | | | | | | 
Db 1460 GTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGC 1519 

Qy 1522 AGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGC 1581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1520 AGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGC 1579 

Qy 1582 CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCC 1641 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 158 0 CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCC 1639 

Qy 1642 ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACT 1701 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1640 ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACT 1699 

Qy 1702 C CT G GAAG CAGGACAT GGAGCGGGGGAAC C C AGAGT GG GCAT GT GC CAGT GGC CC CAT GA 17 61 

I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1700 CCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGA 1759 

Qy 1762 GCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCA 1821 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1760 GCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTA 1819 

Qy 1822 ACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTC 1881 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I.I Ill 

Db 1820 ACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTC 1879 

Qy 18 82 ATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGA 1941 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1880 ATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGA 1939 

Qy 1942 TAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCAT 2001 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1940 T AGT GCAGGATGGAGT T GGGGGT CT CT AC CAGT GCT GGGCAACT GAGAAT GGCTTTT CAT 1999 

Qy 2002 ACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAAC 2061 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2000 ACC CT GT GAT CT C CT ACT GGGT GGAC AG C C AG GAC CAGAC CCTGGCCCT GGAT CCT GAAC 2059 

Qy 2062 TGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCG 2121 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2060 TGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCG 2119 

Qy 2122 CCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCT 2181 

I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I II I II I I I I II I I I I I I I I I I I 
Db 2120 CCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCT 2179 

Qy 2182 TAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTC 2241 



1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


2180 


TAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTC 


2239 


Qy 


2242 


GGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAG 


2301 






i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i tii> i.ii 

1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 1 I I I | | | | | | | | | | | | | | | | 




Db 


2240 


GGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAG 


2299 


Qy 


2302 


AGCAACACCT CCAGT CT C CCAAGGAAT GCAGGACCT CT GC CAGTGAT GT GGACGCT GACA 


2361 






i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i I i i t i * i i * , i , 

1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I I 




Db 


2300 


AG CAACAC C T C C AGT CT C CCAAGGAAT GCAGGAC CT CT GC C AGT GAT GT GGAC GCT GACA 


2359 


Qy 


2362 


ACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAG 


2421 






i i t i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i ■ i ■ i i ■ ■ i i i i i 

1 i 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2360 


ACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAG 


2419 


Qy 


2422 


GCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCAGCAC 


2481 






1 1 { 1 1 t 1 1 I 1 1 1 t t 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 | 1 | 1 | 1 | ■ 1 ■ | ■ « t 1 1 1 !>>■■■> 

l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l | l | M | | | | | | | || | | | | | 




Db 


2420 


GCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCAGCAC 


2479 


Qy 


2482 


AAAA.GACCACCTTTCT CC CCTGAGAGGAGCT TCT GCT ACT CT GCAT CACTGAT GACACT C 


2541 






1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2480 


AAAA.GAC C AC CTTTCTCC C CT GAGAGGAG CT T CT GCT ACT CT GCAT C AC T GAT GACACT C 


2539 


Qy 


2542 


AGCAGGGT GAT GCACAGCAGT CT GCCTCCC CT AT GGGACT C CCTT CT ACCAAGCACAT GA 


2601 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 I I I I I I I I I | I I 




Db 


2540 


AGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGA 


2599 


Qy 


2602 


GCTCT CTAACAGGGT GGGGGCTACC CCCAGACCT GCT C CTACACT GATATT GAAGAACCT 


2661 






i i i i i i ■ i t i i i i i i i i i i i i i * i i i i i • ■ t ■ ■ ■ i i i ■ i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2600 


GCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCT 


2659 


Qy 


2662 


GGAGAGGAT CCTTCAGTT CT GGCCATTCCAGGGACCCT CCAGAAACACAGT GTTT CAAGA 


2721 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 II 1 II 1 1 II II I I 1 I || I 




Db 


2660 


GGAGAGGAT CCTT CAGTT CT GGCCATTCCAGGGACCCT CCAGAAACACAGT GTTT CAAGA 


2719 


Qy 


2722 


GACCCTAAAAAACCT GCCTGT CCCAGGACCCTAT GGTAAT GAACAC CAAACAT CTAAACA 


2781 






i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i ■ i i i i i i i > i i i ■ i i t ■■ ■ ■ • ■ ■ 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2720 


GAC C CT AAAAAAC CT GC C T GT C CC AGGACC CT AT GGTAAT GAACAC CAAACAT CTAAACA 


2779 


Qy 


2782 


AT CAT AT GCT AAC AT G C CACT C CT GGAAACT C CACT CT GAAGCT GC C GCT T T GGACAC C A 


2841 






i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ i.i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I || I 




Db 


2780 


AT CAT AT GC TAACAT GC C ACT C CT GGAAAC T C CACT CT GAAG CT G C C GC T T T GGACAC C A 


2839 


Qy 


2842 


ACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCG 


2901 






■ t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i > i i ■ ■ i , i i i 

M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 | 1 1 1 1 1 | | 




Db 


2840 


ACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCG 


2899 


Qy 


2902 


TGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAG 


2961 






i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ i i i i i i i i i i ■ i , • i i ■ • ■ ■ • i i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 I 1 1 1 I 1 I I 




Db 


2900 


TGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAG 


2959 


Qy 


2962 


TTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCT 


3021 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I II 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2960 


TTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCT 


3019 


Qy 


3022 


TCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGG 


3081 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 3020 TCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGG 3079 

Qy 3082 AT T C AGAAAACT G CT T GT CAGAGACT GT T TAT TT T T TAT T AAAAAT AT AAG G C TT AAAAA 3141 

I i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 308 0 AT T C AGAAAAC T G C T T GT C AGAG AC T GT T TAT T T T T TAT T AAAAAT AT AAG G C T T AAAAA 3139 

Qy 3142 AA 3143 

I I 

Db 3140 AA 3141 
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1. .2981 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db xref="taxon:9606" 



ORIGIN 



Query Match 85.3%; 
Best Local Similarity 96.5%; 
Matches 2793; Conservative 



Score 2682.2; 
Pred. No. 0; 
0 ; Mismatches 



Qy 

Db 

Qy 

Db 



DB 6; Length 2981; 

3; Indels 99; Gaps 



l; 



242 



301 



AGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACAC 

I> I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M 

186 AGGGGAT GAAC GTAGGGCACTT AGCT T CT T C C AC CAGAAGGGC CT CCAG GAT T T T GAC AC 245 



302 TCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGC 361 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | I I I I 

246 TCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGC 305 



Qy 

Db 



362 CTT GGAT AT C C AGGAT CC AG GGGT C C C C AGGCT AAAGAACAT GAT AC C GT G GC C AGC C AG 421 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I I 
306 CT T G GAT AT C CAGGAT C C AGGGGT C C C CAGGC TAAAGAACAT GAT AC C GT GGC C AGC C AG 365 



Qy 

Db 



422 
366 



T GAC AGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGAC AC AGT GT T T CAA 
M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

T GACAGAAAAAAGAGT GAAT GT GC C T T T AAGAAGAAGAG CAAT GAG 



481 
411 



Qy 482 CTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGC 541 
Db 412 411 

Qy 542 CTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGA 601 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 412 GAACTTCAAGATTCCTACCTGTTGCCCATCTCGGA 446 

Qy 602 GGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGC 661 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I | M I I I I I I I I I I I I II I I I I I I I I I I I | I I 
Db 447 GGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGC 5 06 

Qy 662 TGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCC 721 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | M | | | | | | | 
Db 507 TGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCC 566 

Qy 722 CATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTG 781 

Ml I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 567 CAT C CT GAT GC GCAC ACT GG GAT C C C AGC CT GT C CT CAAGAC C GACAACTT CCTCCGCTG 626 

Qy 7 82 GCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTT 841 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I | | | | | | | | | 
Db 627 GCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTT 68 6 

Qy 842 CTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGC 901 

I I I M I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 687 CTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGC 74 6 

Qy 902 T AGAGT C T GCAAGAAT GACGT GGG C G GC GAAAAGCT GCT GCAGAAGAAGT GGAC C AC CTT 961 

I I I I I I M I I I I I I I II I I I I I I II I I I I I || I I I I I I I | | | | | | | | | | | | | | | | | | | | | 
Db 747 T AGAGT CT GCAAGAAT GACGT GGG C GGC GAAAAG CT GCT GCAGAAGAAGT GGAC C AC CTT 806 

Qy 962 CCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCA 1021 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | 
Db 807 CCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCA 8 66 

Qy 1022 CGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTC 1081 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 867 CGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTC 92 6 

Qy 1082 CCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACAT 1141 

I I I I I M I I I I I I I I I I I I I I I I I I I I I i I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 
Db 927 CCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACAT 98 6 

Qy 1142 T GAAC GT GT CT T TAAGGGGAAAT ACAAAGAGT T GAACAAAGAAACTT CAC GCT GGACT AC 12 01 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I i I I I I I I I I I I I I 
Db 987 T GAAC GT GT CT TTAAGGG GAAAT ACAAAGAGT T GAACAAAGAAACT T CACG CT GGAC T AC 1046 

Qy 1202 TTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGA 1261 

I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1047 TTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGA 1106 

Qy 1262 TAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCC 1321 

I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1107 T AAG GC C CT GAC CT T CAT GAAGGAC CAT T T C CT GAT G GAT GAG CAAGT G GT GGGGAC GC C 1166 



Qy 1322 CCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCT 1381 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I II I I I I I I I | | | I I I I | | | | | 
Db 1167 CCTGCTGGT GAAAT CTGGCGTG GAGT AT ACAC G G CT T G C AGT G GAGAC AG C C CAGG GC C T 1226 

Qy 1382 T GAT G G GC AC AGC C AT CT T GT CAT GT AC C T G G GAAC C AC C AC AGGGT C GC T C CACAAG G C 14 41 

M I I I I I I I I I I II I I I I I I I I I I I I I I I I | M | | | | | | | | | | | | | | | | | | | I I I I I I I I 
Db 1227 TGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGC 1286 

Qy 1442 T GT GGT AAGT G G G GAC AGCAGT GCT CAT CT GGT G GAAGAGATT CAGCT GT T C CCT GAC C C 1501 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II I | I | I | | | | | | | | 
Db 1287 TGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCC 1346 

Qy 1502 TGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTC 1561 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1347 TGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTC 1406 

Qy 1562 AGGAGGT GT CT GGAGGGT GC CC CGAGC CAACT GTAGT GT CT AT GAGAGCT GT GT GGACT G 1621 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 07 AGGAGGT GT C T GGAGGGT GC C C C GAG CC AAC T GTAGT GT CT AT GAGAG CT GT GT GGACT G 14 66 

Qy 1622 TGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCT 1681 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 67 TGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCT 1526 

Qy 1682 GTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGC 1741 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1527 GTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGC 1586 

Qy 1742 AT GT GC CAGT G GC CC CAT GAGC AGGAGC C T T C GGC CT C AGAG C CGCCC GCAAAT C ATTAA 1801 

I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1587 AT GTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCC GCAAAT CATTAA 164 6 

Qy 18 02 AGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTT 1861 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1647 AGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTT 1706 

Qy 1862 GGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTA 1921 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1707 GGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTA 1766 

Qy 1922 CAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGC 1981 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 17 67 CAAT GGCT C CCT CTT GCT GAT AGT GCAGGAT GGAGTT GGGGGT CT CTACCAGT GCT GGGC 182 6 

Qy 1982 AACT GAGAAT GGCT T T T CAT AC CCT GT GAT CT C CT ACT G GGT GGACAG C C AGGAC CAGAC 2041 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1827 AACT GAGAATGGCTTTT CAT AC CCT GT GAT CT CCT ACT GGGT GGGCAGCCAGGAC CAGAC 1886 

Qy 2042 CCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGAC 2101 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1887 CCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGAC 194 6 

Qy 2102 CAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCAC 2161 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1947 CAGGGT CAGT GGT GGGGCCGCCCT GGCT GCCCAGCAGTCCTACTGGCCCCACTTTGTCAC 2006 

Qy 2162 TGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCC 2221 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


2007 


TGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCC 


2066 


Qy 


2222 


ATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGA 


2281 






1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 i 1 1 1 1 1 1 | | | | 1 1 | 1 | | 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 | | 1 1 




Db 


2067 


ATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGA 


2126 


Qy 


2282 


GAAG GC C C C GT T AAGCAGAGAGCAACACCT C C AGT CT C C CAAGGAAT GC AG GAC CT CT GC 


2341 






M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 




Db 


2127 


GAAGGC C C C GTTAAGCAGAGAG CAAC AC C T C CAGT CT C C CAAGGAAT GC AGGAC CT CT G C 


2186 


Qy 


2342 


CAGT GAT GT GGAC GC T GACAACAACT GCCTAGG CAC T GAGGT AGCT TAAACT C T AGGCAC 


2401 






1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 I 




Db 


2187 


CAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCAC 


2246 


Qy 


2402 


AGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCT 


2461 






1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2247 


AGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCT 


2306 


Qy 


2462 


GACT AGGAT GAC AGC AGC ACAAAAGAC C AC CTTT CT C C CCT GAGAGGAGCT T C T GCTACT 


2521 






1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2307 


GACT AGGAT GACAGCAGC ACAAAAGAC C AC CT T T C T C C C CT GAGAGGAGCT T CT GCTACT 


2366 


Qy 


2522 


CT GCAT CACT GAT GACAC T C AGCAGG GT GAT GC AC AGCAGT CT G C CT CC CC T AT GGGACT 


2581 






1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 




Db 


2367 


CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GCCT CC CCT AT GGGACT 


2426 


Qy 


2582 


CCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCT 


2641 






II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 I I I I I I | | | | 




Db 


2427 


CCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCT 


2486 


Qy 


2642 


ACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTCC 


2701 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


2487 


ACACTGAT ATT GAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCATT CCAGGGACCCT CC 


2546 


Qy 


2702 


AGAAACACAGT GT T T CAAGAGACCCTAAAAAAC CT G C CT GT C CCAGGAC C CT AT G GTAAT 


2761 






1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 I I 1 1 I 1 I I 




Db 


2547 


AGAAACACAGT GTTT CAAGAGACCCTAAAAAACCT GCCTGTCCCAGGAC CCTATGGTAAT 


2606 


Qy 


2762 


GAAC AC CAAACAT CT AAACAAT CAT AT GCT AACAT G C CAC T C CT GGAAACT C CACT CT GA 


2821 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2607 


GAACAC CAAACAT CTAAACAAT CATATGCTAACAT GCCACT CCT GGAAACTCCACT CT GA 


2666 


Qy 


2822 


AGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCT 


2881 






M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I I I I I I I | | | | | || | | | | | | | || 




Db 


2667 


AGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCT 


2726 


Qy 


2882 


CCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGAC 


2941 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I I I I I I 1 I I I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


2727 


CCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGAC 


2786 


Qy 


2942 


CACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGC 


3001 


Db 


2787 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CACCTTTCTTCTTGCTTCAGTTGGGGCAGACTTTGATCCCTTCTGCCCTGGCAGAATGGC 


2846 


Qy 


3002 


AGGGGTAATCTGAGCCTTCTT CACT CCTTTACCCTAGCTGACC CCTT CACCTCTCCCCCT 


3061 



1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 



Db 



2847 AGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCT 2906 



Qy 

Db 

Qy 

Db 



3062 CCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTATT 3121 

1 1 1 1 1 1 1 1 1 1 i M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 li 1 1 1 1 1 1 1 1 M li 1 1 1 1 1 1 1 1 1 1 

2907 CCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTATT 2966 

3122 AAAAATATAAGGCTT 3136 

I I I I I I I I I I I I I I I 
2 967 AAAAATATAAGGCTT 2 981 
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Location/ Qualifiers 

1. .2981 

/organism= f, Homo sapiens " 

/mol_type="mRNA" 

/ db_xr e f = " t axon : 9 6 0 6 " 

/ clone= " CTONG2 001749" 

/tissue_type="tongue, tumor tissue" 

/ clone_lib= " CTONG2 " 

/note="cloning vector: pME18SFL3" 



Query Match 85.3%; Score 2682.2; DB 9; Length 2981; 

Best Local Similarity 96.5%; Pred. No. 0; 

Matches 2793; Conservative 0; Mismatches 3; Indels 99; Gaps 1; 

Qy 2 42 AG GG GAT GAACGT AGGGCACT T AGCTT CT T CCAC CAGAAGGGC CT CC AGGAT T T T GAC AC 301 

I I I I M I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | 1 | | | | 
Db 186 AGG GGAT GAACGT AGG GC ACTT AG C T T CT T C CAC CAGAAGGGC CT C CAGGATT T T GACAC 245 

Qy 302 TCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGC 361 

I M I I I 1 I I I I I I I I II I I I I I I I I I I I I I I I I I I! I I I I I I I I I II I I I I I I I I I I I I I 

Db 246 TCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGC 305 

Qy 362 C T T GGAT AT C C AG GAT CC AG GGGT C C C C AG GCT AAAGAAC AT GAT AC CGT GGC CAGC CAG 421 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I | | | | | | | | | | 
Db 306 CT T GGAT AT C CAGGAT C C AGGGGT C C C C AGG C TAAAGAACAT GAT AC C GT GGC CAGC CAG 365 

Qy 422 T GACAGAAAAAAGAGT GAAT GT GC CT T TAAGAAGAAGAGCAAT GAGACACAGT GT T T CAA 4 81 

I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 366 T GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAAT GAG 411 

Qy 482 CTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGC 541 
Db 412 411 

Qy 542 CTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGA 601 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 412 GAAC T T CAAGAT T C CT AC CT GT T GCC CATCT C G GA 44 6 

Qy 602 GGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGC 661 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I || I 
Db 447 GGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGC 506 

Qy 662 TGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCC 721 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I 

Db 507 T GT CTT GGT GGAT GGGAT GCT CT ATT CT GGTACTAT GAACAACTT C CT GGGCAGT GAGCC 566 

Qy 722 CAT C CT GAT GC GCACAC T GG GAT C CCAGC CT GT C CT CAAGAC C GACAACT T CCT C CGCT G 781 

I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 567 CATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTG 626 

Qy 782 GCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTT 841 

I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 627 GCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTT 686 

Qy 842 CTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGC 901 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I || M I I I I I I I 

Db 687 CTT C GAGGAGAC AGC CAGC GAGT T T GACT T CT T T GAGAG GCT C CACACAT C GC GGGT GGC 746 

Qy 902 T AGAGT CT GCAAGAAT GAC GT G GGCGGC GAAAAGCT GCT GCAGAAGAAGT GGACC AC CT T 961 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 747 T AGAGT CT GCAAGAAT GAC GT GG G CGGC GAAAAGCT GCT GCAGAAGAAGT GGACCAC CT T 806 

Qy 962 CCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCA 1021 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 07 CCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCA 866 



Qy 1022 CGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTC 1081 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 
Db 8 67 CGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTC 92 6 

Qy 1082 CCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACAT 1141 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 927 CCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACAT 98 6 

Qy 1142 T GAAC GT GTCTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACTAC 12 01 

I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 987 T GAAC GT GT CTTTAAGGGGAAATACAAAGAGT T GAACAAAGAAACTT CACGCT GGACTAC 104 6 

Qy 1202 TTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGA 12 61 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1047 TTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGA 1106 

Qy 1262 TAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCC 1321 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1107 T AAGG C C CT GAC CT T CAT GAAG GACC ATTT C C T GAT GGAT GAGCAAGT GGT GGGGAC G C C 1166 

Qy 1322 CCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCT 1381 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 1 
Db 1167 CCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCT 1226 

Qy 1382 T GAT GGGC ACAGC CAT CT T GT CAT GT AC CT GG GAACCAC CAC AGGGT CG CT C C ACAAG GC 1441 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1227 T GAT GGGCAC AGC CAT CTT GTC AT GT AC CT G G GAAC CAC CACAGGGT CG CT CCACAAGGC 12 8 6 

Qy 1442 T GT GGTAAGT GGGGACAGCAGT GCTCAT CT GGTGGAAGAGATT CAGCTGTT CC CT GACCC 1501 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 87 T GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT CAGCTGTT CC CT GAC CC 134 6 

Qy 1502 TGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTC 1561 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1347 TGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTC 14 06 

Qy 1562 AGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTG 1621 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 07 AGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTG 1466 

Qy 1622 TGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCT 1681 

I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I 
Db 14 67 TGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCT 1526 

Qy 1682 GTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGC 1741 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1527 GTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGC 1586 

Qy 1742 ATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAA 1801 

I I I I I I I II I I I I I M I I I I I I I I I I I I I I i I I I I I 1 1 I I I I I I I I I I I I I I I I I I 1 1 I I 

Db 1587 AT GT GC CAGT G GC C C CAT GAGCAG GAGC CT T C GGC CT C AGAGC C GC C C GCAAAT CAT T AA 1646 

Qy 1802 AGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTT 1861 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1647 AGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTT 1706 

Qy 1862 GGC CT CT T AT TAT T GGAGT CAT GG CC CAGC AGCAGT C C C AGAAGC CT CT TC CACT GT CT A 1921 



I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I f I 

Db 17 07 GGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTA 1766 

Qy 1922 CAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGC 1981 

I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I i I I I I I I I I I M I I I I I I II I 
Db 1767 CAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGC 1826 

Qy 1982 AACT GAGAAT GGC TT TT CAT AC C CT GT GAT C T C CT ACT GGGT G GAC AGC CAGGAC CAGAC 2041 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I M I I I I I I I I II I I I I I 
Db 1827 AACT GAGAAT GGCTT TT C AT AC C CT GT GAT CT C CTACT GGGT G GGC AGC CAGGAC CAGAC 1886 

Qy 2042 CCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGAC 2101 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M 
Db 18 87 CCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGAC 194 6 

Qy 2102 CAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCAC 2161 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | M I I I 
Db 1947 CAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCAC 2006 

Qy 2162 TGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCC 2221 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2007 TGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCC 2066 

Qy 2222 ATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGA 2281 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2067 ATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGA 2126 

Qy 2282 GAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGT CT C C CAAGGAAT GCAGGACCT CT GC 2341 

I I 1 1 1 I I I I I I I i I 1 1 1 I I 1 1 I I I 1 1 I I I I I 1 1 I II I I I 1 1 I I I I I I I I I I I 1 1 I 1 1 1 M 

Db 2127 GAAGGC CC CGTTAAGCAGAGAGCAACAC CT C CAGT CT CC CAAGGAAT G CAGGAC CT CT GC 218 6 

Qy 2342 CAGT GAT GT GGAC GCT GACAACAACT GC CT AGGCACT GAGGT AGCT T AAAC T C TAGGC AC 2401 

I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2187 CAGT GAT GT GGAC GCT GACAACAACTGCCTAGGCACTGAGGT AG CTTAAACTCTAGGCAC 2246 

Qy 2402 AGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCT 2461 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2247 AGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCT 2306 

Qy 2462 GACTAGGAT GACAGCAGCACAAAAGAC CAC CTTT CTCCCCT GAGAGGAGCTT CT GCTACT 2521 

II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I 

Db 2307 GACTAGGAT GAC AGCAGCACAAAAGACC AC CTT T CT C C C CTGAGAGGAGCT T CT GCT ACT 2366 

Qy 2522 CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GCCT CCC CTAT GGGACT 2581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2367 CT GCAT CACT GAT GACACT CAGC AGG GT GAT GCACAGCAGT CT GC CT C C C CT AT G GGACT 242 6 

Qy 2582 CCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCT 2641 

M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | | | I I || || II I I I I I I I I II I I 
Db 2427 CCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCT 24 86 

Qy 2642 AC ACT GAT ATT GAAGAACCT GGAGAG GAT C CT T CAGT T CT GGCCAT T C C AG GGAC C CT CC 2701 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2487 ACACT GAT AT T GAAGAACCT GGAGAGGAT C CT T CAGT T CT GG C CAT T C CAG GGAC C CT C C 2546 

Qy 2702 AGAAAC AC AGT GT T T CAAGAGAC C CTAAAAAAC CT GC CT GT C CCAGGAC C CT AT GGT AAT 2761 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | || | | | | | | | | | M I I I I I I I 



Db 



2547 AGAAACACAGT GT TT CAAGAGAC C CT AAAAAACCT G C CT GT C C C AG GAC C CT AT GGT AAT 2606 



Qy 


2, /bZ 


GAACAC CAAACAT CTAAACAAT CAT AT GCTAACATG CC AC T C CT GGAAACT C CACT CT GA 2821 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 II 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 II 1 1 1 1 1 II 1 I 1 1 1 1 1 II 1 II 




Db 


2607 


GAACAC CAAACAT CTAAACAAT CAT AT GCTAACAT GC C ACT C CT GGAAACT C CAC T C T GA 2 666 


Qy 


o o o o 
2822 


AGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCT 


2881 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 I M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 




Db 


2667 


AGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCT 


2726 


Qy 


2882 


CCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGAC 


2941 






1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I M I I I 1 I I I I I I I I I I | | | | | | | 




Db 


2727 


CCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGAC 


2786 


Qy 


2942 


CACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGC 








1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2787 


CACCTTTCTTCTTGCTTCAGTTGGGGCAGACTTTGATCCCTTCTGCCCTGGCAGAATGGC 


2846 


Qy 


3002 


AGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCT 


3061 






1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 I I I I I I I I | | | | M | | | | | | | | | 




Db 


2847 


AGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCT 


2906 


Qy 


3062 


CCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTATT 


3121 






1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


2907 


CCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTATT 


2966 


Qy 


3122 


AAAAATATAAGGCTT 3136 








1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2967 


AAAAATATAAGGCTT 2981 
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AX512887 2768 bp DNA linear PAT 03-OCT-2002 

Sequence 35 from Patent WO02062841. 

AX512887 

AX512887. 1 GI: 2350404 6 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Tang,T.Y., Yue, H . , Gandhi,A.R., Yao,M. G. , Warren, B. A. , Ding,L., 
Duggan,B.M., Xu,Y., Yang, J., Thangavelu, K. , Lal,P.G., 
Honchell,C.D. , Walia,N.K., Lee,S., Lee, E . A. , Richardson, T .W. , 
Baughn,M.R. and Elliott, V.S. 
Secreted proteins 

Patent: WO 02062841-A 35 15-AUG-2002; 
Incyte Genomics, Inc. (US) 

Location/Qualifiers 

1. .2768 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon: 9606" 
/note="Incyte ID No: 7487507CB1" 



Query Match 78.8%; Score 2476.4; DB 6; Length 2768; 

Best Local Similarity 96.5%; Pred. No. 0; 

Matches 2580; Conservative 0; Mismatches 1; Indels 93; Gaps 1 

Qy 74 AGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCC 133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 169 AGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCC 228 

Qy 134 CTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGAC 193 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I i I I I I I I I I I I 

Db 229 CTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGAC 288 

Qy 194 CGC GGGGGGAGGCGGGCAGGGGCC CAT GCC CAGGGT CAGAT ACTAT GCAGGGGAT GAAC G 253 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 289 C GC GG GGGGAGG C G GGC AG G GG C C C AT GC CCAGG GT CAGAT AC TAT G CAGGG GAT GAAC G 34 8 

Qy 254 TAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAG 313 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 349 T AG GGCACTT AGCT T CTT C CAC CAGAAGG GC CT C CAGGAT T T T GAC AC T CT G CT C CT GAG 4 08 

Qy 314 TGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCA 373 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 409 TGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCA 4 68 

Qy 374 GGATC CAGGGGT C C C CAGGCTAAAGAAC AT GAT ACC GT GGC CAGC CAGTGAC AGAAAAAA 433 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 4 69 GGAT C C AG G GGT C C C C AGG CTAAAGAAC AT GAT AC C GT GGC CAGC CAGT GAC AGAAAAAA 528 

Qy 434 GAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGACACAGT GT T T CAACT T CAT C C GT GT 493 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 529 GAGT GAAT GT GC CTT TAAGAAGAAGAG CAAT GAGACACAGT GT TT CAACT T CAT C C GT GT 588 

Qy 4 94 CCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGC 553 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I II I I I I I I I I I I 
Db 58 9 CCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGC 64 8 

Qy 554 T T GTACCT T CAT T GAACTT CAAGATT C CT AC CT GTT GC C C AT CT C GGAGGACAAGGT CAT 613 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I | | I | | 
Db 649 T T GT AC CT T CAT T GAACTT CAAGATT C CT AC CT GT T GC C CAT CT C GGAG GACAAGGT CAT 7 08 

Qy 614 GGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGA 673 

M I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 709 GGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGA 768 

Qy 674 TGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCG 733 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 769 TGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCG 828 

Qy 734 CACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGA 7 93 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 829 CAC AC T G GGAT C C CAGC CT GT C CT CAAGACC GACAACT TCCTCCGCT GGC T GC AT CAT GA 88 8 

Qy 794 CGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGAC 853 

I I I I I I I M M I M I I I I I I I I I I I I | | | | | | | | | | | | | | | | || | | | | | | | | | | | | | | || 

Db 889 CGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGAC 948 



Qy 854 AGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAA 913 

M I I I I II I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I | | | | | | | | | | I I I I I I I I 
Db 94 9 AGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAA 1008 

QY 914 GAAT GAC GT GGGCGGC GAAAAGCTGCT GCAGAAGAAGT GGAC CACCTT C CT GAAGGCC CA 973 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | | | | | | | | || | | | || | | 
Db 1009 GAAT GACGT GGGCGGC GAAAAGCTGCT GCAGAAGAAGT GGAC CACCTTCCT GAAGGCC CA 1068 

Qy 974 GCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCT 1033 

I M I M I I I I I I I I I I I I I I I I I I I I I | I | | | | M I I I I I I I I I I I I I I M I I I I I I I I I 

Db 1069 GCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCT 1128 

Qy 1034 C C C C GC C GAT T CT C C C AC AGC T C C C C AC AT CT AC GCAGT CT T C AC CT C C C AGT GGC AGGT 1093 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 112 9 CCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGT 1188 

Qy 1094 TGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTT 1153 

I I I I I I I M I I I I I I I I I I II I I I I M I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I 

Db 1189 TGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTT 124 8 

Qy 1154 TAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACTACTTATAGGGGC CC 1213 

M I I I I I I I I I II I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | || | | 

Db 1249 T AAG G G GAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT G GACT ACTT AT AGGG GC C C 1308 

Qy 1214 TGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGAC 1273 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | || | | | | | | | | 
Db 13 09 TGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGAC 1368 

Qy 1274 CT T CAT GAAGGAC CATTT C CT GAT GGAT GAGCAAGTGGT GGG GAC GC C CCT G CT GGT GAA 1333 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | M I I 
Db 1369 CT T CAT GAAGGAC CAT T T C CT GAT GGAT GAG C AAGT G GT G G GGAC GC C CCTGCTGGT GAA 1428 

Qy 1334 AT CT GGC GT GGAGT AT ACAC GGCT T GCAGT G GAGACAGC C CAGGGC CTT GAT GG GCAC AG 1393 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I Mill 

Db 1429 ATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAG 1488 

Qy 1394 CCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGG 1453 

M I I II I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I II I I II 
Db 1489 CCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGT 1539 

Qy 1454 GGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCG 1513 
Db 1540 1539 

Qy 1514 CAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTG 1573 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1540 GGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTG 1575 

Qy 1574 GAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCG 1633 

I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I Ill 

Db 1576 GAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCG 1635 

Qy 1634 GGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAA 1693 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1636 GGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAA 1695 

Qy 1694 CCT GAACTCCT GGAAGCAGGACAT GGAGCGGGGGAACCCAGAGT GGGCAT GT GCCAGTGG 1753 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


1696 


CCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGG 


1755 


Qy 


1754 


CCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGC 


1813 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I I 1 1 




Db 


1756 


C C C CAT GAGC AGGAGC CT T C GG C CT C AGAGC C G C C CGCAAAT CAT TAAAGAAGT CC T G GC 


1815 


Qy 


1814 


TGTCCCCTUVCTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTA 1873 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 




Db 


1816 


TGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTA 1875 


Qy 


1874 


TTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCT 


1933 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I | | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 1 1 1 1 




Db 


1876 


TTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCT 


1935 


Qy 


1934 


CTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGG 


1993 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 I I M 




Db 


1936 


CTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGG 


1995 


Qy 


1994 


CTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGA 


2053 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I | I | I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | 




Db 


1996 


CT T T T CAT AC CC T GT GAT CT C C TACT GG GT G GACAGC CAGGAC CAGAC CCTGGCCCT GGA 


2055 


Qy 


2054 


TCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGG 


2113 






1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I | | | | | | 




Db 


2056 


TCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGG 


2115 


Qy 


2114 


TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCT 


2173 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I 




Db 


2116 


TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCT 


2175 


Qy 


2174 


CTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACT 


2233 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I | | | | | 1 1 1 1 1 1 1 1 




Db 


2176 


CT T T GC CT T AGT GCTT T C AGGAGC C CT C AT CAT C C T C GT GG CCT C CC CATT GAGAGC ACT 


2235 


Qy 


2234 


CCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTT 


2293 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


2236 


CCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTT 


2295 


Qy 


2294 


AAGCAGAGAGCAACACCT CCAGT CT CCCAAGGAAT GCAGGACCT CT GCCAGT GAT GT GGA 


2353 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2296 


AAGCAGAGAGCAAC AC CT C CAGT CT C C CAAGGAAT G C AG GAC CT CT G CCAGT GAT GT GGA 


2355 


Qy 


2354 


CGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTG 


2413 






1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


2356 


CGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTG 


2415 


Qy 


2414 


CGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGAC 


2473 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M I | | | || || | | || || | | | | | || 




Db 


2416 


CGGTGCAGGCACCCGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGAC 


2475 


Qy 


2474 


AGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGA 


2533 


Db 


2476 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | I I | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 

AGC AGC ACAAAAGAC C AC CT TT CT CC C CT GAGAG GAG CT T CT GCT ACT CT GCAT C ACT GA 


2535 


Qy 


2534 


TGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAA 


2593 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 2536 TGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAA 2595 

Qy 2594 GC AC AT GAGCT CTC TAACAG GGT G G G G G C T ACCC C CAGAC C T G CT C CT ACACT GAT AT T G 2653 

I I I i I I I I M I I I I I I I I I I I I f I I I i I I I I I I I II I II I I I I I | || | | | | | | | | | | | | | 
Db 2596 GCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTG 2655 

Qy 2654 AAGAAC C T G GAGAGGAT C CT T CAGT T CT GGC C AT T C CAGGGAC CCT C CAGAAAC ACAGT G 2713 

I I I I I I I I I II I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I | | | | | | | | | | | | | | | | 
Db 2656 AAGAAC CT G GAGAGGAT C CT T CAGT T CT GG C CAT T C CAGG GAC CC T C CAGAAAC ACAGT G 2715 

Qy 2714 TTTCAAGAGACCCTAAAAAACCTGCCTGTCCCAG 2747 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I 
Db 2716 T T T CAAGAGAC C C TAAAAAAC CT GC CT GT C C C AG 2749 
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AX528271 2281 bp 

Sequence 9 from Patent WO0206339, 
AX528271 

AX528271. 1 GI: 25172573 



DNA 



linear PAT 21-NOV-2002 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Spaderna, S.K., Tchernev,V., Liu,X., Shenoy,S., Spytek,K., 

Zerhusen,B., Pattura j an, M. , Taupier , R. J. , Rastelli,L., Grosse,W.M., 

Szekeres,E.S. , Alsobrook, J. I . , Lepley, D . M. , Shen,L., Burgess , C . E . , 

Shimkets, R. A. and Padigaru,M. 

Proteins and nucleic acids encoding same 

Patent: WO 0206339-A 9 24-JAN-2002; 

Curagen Corporation (US) 

Location/Qualifiers 

1. .2281 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 72.6%; Score 2281; DB 6; Length 2281; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2281; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


125 


CCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCC 

N 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

CCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCC 


184 


Db 


2281 


2222 


Qy 


185 


GACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 I I I 1 1 1 

GACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGG 


244 


Db 


2221 


2162 


Qy 


245 


GGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

GGAT GAAC GT AGGGC ACT T AG C T T CT T C CAC CAGAAGGGC CT CC AGGAT T T T GAC AC T CT 


304 


Db 


2161 


2102 



Qy 305 GCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTT 364 

I I I M I I I I I I I I I I I I I I ! I! I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 2101 GCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTT 2 042 

QY 365 G GAT AT C C AGGAT C C AG GGGT C C C CAG GC T AAAGAACAT GAT AC C GT GGC C AGC C AGT GA 424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GGAT AT CC AGGAT C CAG GG GT C C C CAG GC TAAAGAAC AT GAT AC C GT GGC C AGC CAGT GA 1982 

Qy 425 C AGAAAAAAGAGT GAAT GT GC C T T T AAGAAGAAGAGC AAT GAGAC ACAGT GT T T CAACT T 4 84 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1981 C AGAAAAAAGAGT GAAT GT GCCTT T AAGAAGAAGAGCAAT GAGAC AC AGT GT T T CAACTT 1922 

Qy 485 CATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTT 544 

I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II | | | | | | | | | | | | || | 
Db 1921 CATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTT 1862 

Qy 545 CAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGA 604 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I | | | | | | || | | | | | | | | 

Db 1861 CAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGA 1802 

Qy 605 CAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGT 664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | 
Db 1801 CAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGT 1742 

Qy 665 CTTGGT GGAT G GGAT GCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGT GAG CCCAT 724 

M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I | | M I I I I I I I I I I I I I M 
Db 1741 CT T GGT GGAT GGGAT G CT CT AT T CT GGT ACT AT GAACAACT T C CT GGGC AGT GAGC C CAT 1682 

Qy 725 CCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCT 7 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCT 1622 

Qy 785 GCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTT 844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | M I II 
Db 1621 GCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTT 1562 

Qy 845 C GAGGAGAC AGC CAG C GAGT T T GACT T CTT T GAGAGGCT C C ACACAT C G CGGGT GGCTAG 904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 1561 C GAGGAGAC AGC CAG C GAGT T T GACT T CTTT GAGAGGCT C CAC AC AT C GCGGGT GGCTAG 1502 

Qy 905 AGT CT GCAAGAAT GACGT GGGC GGCGAAAAGCTGCTGCAGAAGAAGT GGAC CACCTTCCT 9 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I II 
Db 1501 AGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCT 1442 

Qy 965 GAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGC 1024 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I | | 
Db 1441 GAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGC 1382 

Qy 1025 GGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCA 1084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I Mill 

Db 1381 GGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCA 1322 

Qy 1085 GTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGA 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I 1 I I I ! I I I I I 1 I I I I I I I 

Db 1321 GTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGA 1262 

Qy 1145 ACGT GTCTT TAAGGG GAAAT ACAAAGAGTT GAACAAAGAAACT T C AC GC T GGACT ACT T A 1204 



Db 


1261 


Qy 


1205 


Db 


1201 


Qy 


1265 


Db 


1141 


Qy 


1325 


Db 


1081 


Qy 


1385 


Db 


1021 


Qy 


1445 


Db 


961 


Qy 


1505 


Db 


901 


Qy 


1565 


Db 


841 


Qy 


1625 


Db 


781 


Qy 


1685 


Db 


721 


Qy 


1745 


Db 


661 


Qy 


1805 


Db 


601 


Qy 


1865 


Db 


541 


Qy 


1925 


Db 


481 


Qy 


1985 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

AC GT GT CTT T AAGGGGAAAT ACAAAGAGT T GAACAAAGAAAC T T C AC G CT G GACT ACTT A 1202 

TAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAA 1264 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAA 1142 

GGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCT 1324 

I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | || 

GGC CCT GAC CT T CAT GAAG GAC CAT T T C CT GAT GGAT GAGCAAGT GGT GGG GACGC C CCT 1082 

GCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGA 1384 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I | | | | | | 

GCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGA 1022 

TGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGT 144 4 
I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | I | | | 
TGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGT 962 

GGTAAGT GGGGACAGCAGT GCT CATCT GGT GGAAGAGATT CAGCT GTTC CCT GAC CCT GA 1504 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I 

GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT CAGCT GTT CCCT GAC CCT GA 902 

ACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGG 1564 
I I I I I I I M I I I I I I I II I I I I I I I I I | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | | 
ACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGG 842 

AGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGT 1624 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGGT GT CT GGAGGGT GC CC C GAGCCAACT GTAGT GT CT AT GAGAGCT GT GT GGACT GT GT 782 

CCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTC 1684 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 

CCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTC 722 

TGCCC CCAACCT GAACTC CT GGAAGCAGGACAT GGAGCGGGGGAACCCAGAGT GGGCAT G 1744 
I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GC C C C CAAC CT GAACT CCT GGAAGCAGGACAT GGAGC GGG GGAACC CAGAGT G GGCAT G 662 

T GC CAGT GG C C C CAT GAGCAG GAG CCTTCGGCCT C AGAG C C G C C C GCAAAT CAT T AAAGA 18 04 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I | | II I I II I I I I I I I I I I I II I II I 
T GC CAGT GGC C C CAT GAG CAGGAGC CTT CGGC CT C AGAGC C GC CC GCAAAT CAT T AAAGA 602 

AGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGC 1864 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | 
AGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGC 542 

CTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAA 1924 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C T CT T AT TAT T G GAGT CAT GGC CC AG C AGC AGT C C CAGAAGCCT CTT CC ACT GT CT ACAA 482 

TGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAAC 1984 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I | I I I I I I II II I I I I I I I I I I I I I I I I I 

TGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAAC 422 

T GAGAAT GGCTTTT CATACCCT GT GATCTCCTACT GGGT GGACAGCCAGGAC CAGACC CT 2044 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Do 


421 


Qy 


2045 


Db 


361 


Qy 


2105 


Db 


301 


Qy 


2165 


Db 


241 


Qy 


2225 


Db 


181 


Qy 


2285 


Db 


121 


Qy 


2345 


Db 


61 


Qy 


2405 


Db 


1 



T GAGAAT GGCTT T T CAT AC C CT GT GAT CT C C TACT GGGT GGACAGC CAG GAC CAGAC C CT 3 62 

GGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAG 2104 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | M I 

GGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAG 302 

GGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGT 2164 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | M I I I I I I I I I I I I 

GGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGT 242 

CACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATT 2224 
M I I I I I I I I I I I I 1 I II I 1 I I I I I I I I i I I I I I I I I I I I I | | | | M | | | | | | I I I I I I I 
CACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATT 182 

GAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAA 2284 
I I I M I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | i| | | | | | | | | | | | 

GAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAA 122 
GG C C CC GT TAAG CAGAGAGCAACAC CT C C AGT CT C C CAAGGAAT GCAGGAC CT CT GCC AG 2344 

I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I M I I M I I I II I I 

GGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCC CAAGGAAT GCAGGACCTCTGCCAG 62 

T GAT GT GGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACT CTAGGCACAGG 2404 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I 
T GAT GT GGACGCTGACAACAACTGCCTAGGCACT GAGGTAGCTTAAACT CTAGGCACAGG 2 
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DEFINITION 
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KEYWORDS 
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AX528269 2271 bp DNA linear PAT 21-NOV-2002 

Sequence 7 from Patent WO0206339. 

AX528269 

AX528269. 1 GI: 25172572 

Homo s apiens ( human ) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 



Spaderna, S.K 
Zerhusen f B. , 
Szekeres, E. S 
Shimkets, R. A 



, Tchernev,V. , Liu,X., Shenoy,S., Spytek,K., 
Patturajan,M. , Taupier, R. J. , Rastelli,L., Grosse,W.M., 
, Alsobrook, J.I., Lepley,D.M., Shen,L., Burgess , C . E . , 
and Padigaru,M. 
Proteins and nucleic acids encoding same 
Patent: WO 0206339-A 7 24-JAN-2002; 
Curagen Corporation (US) 

Location/Qualifiers 
1. .2271 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 70.9%; Score 2228.4; DB 6; Length 2271; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2260; Conservative 0; Mismatches 11; Indels 15; Gaps 1 
QY 105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I I I M I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | 

Db 1 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 60 

Qy 165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

I I I I I I M I I I I I I I I I I I I I I | | | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | | | || | 

Db 61 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 120 

QY 225 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 284 

I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 121 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 180 

Qy 285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
D b 181 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 24 0 

Qy 345 CGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATG 4 04 

I I M I I I I I I I M I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
Db 241 C GAGAAGC CAT T CT GG C C TT GGAT AT C C AG GAT C CAGGGGT C C C C AGGCT AAAGAAC AT G 300 

Qy 4 05 AT AC C GT GGC C AG C C AGT GACAGAAAAAAGAGT GAAT GT GC CT TT AAGAAGAAGAGCAAT 4 64 

I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ill 

Db 301 ATACCGT GGCCAGCCAGT GACAGAAAAAAGAGT GAAT GT GCCTT T AAGAAGAAGAGCAAT 360 

Qy 4 65 GAGACACAGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTAC 52 4 

I I I I I M I I I I I II I I I I II I I I I | | | | | | | | | | M I I I I I I I I II I I I I I I I | | | | | | | 

D b 361 GAGACACAGT GT T T C AACT T CAT C C GT GT CCTGGTTTCT T ACAAT GT C ACC C AT CT CTAC 42 0 

Qy 525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 
Db 421 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 480 

Qy 585 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 644 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 540 

Qy 645 GCT CACAAGC AT AC GGCT GT CTTGGT GGAT GG GAT GCTCT AT TCTGGT ACT AT GAACAAC 704 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
Db 541 G CT CACAAGCATAC GGCT GT CT T GGT GGAT GGGAT G CT CT AT T CT G GT ACT AT GAACAAC 60 0 

Qy 705 T TC CT GGGC AGT GAG C C CAT C CT GAT GC GC ACACTG GGAT C C CAGC CT GT C CT CAAGAC C 764 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 601 TT C CT GGGC AGT GAG C C CAT C CT GAT GC GCACACT GGGAT C C CAG C CT GT C CT CAAGAC C 660 

Qy 765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 72 0 

Qy 825 CAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTC 884 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTC 78 0 



Qy 



885 CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 944 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



781 



945 



841 



1005 



901 



1065 



I I I III II I! II I I I! II I Ml I II I II I II MM II II II M |[ I | | | | | | | | || || | | 

CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 



840 



AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

I I I I I I I I I I M II II I I II I I I I I I II II I II II I II II I II II II I I I I I II I 

AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 900 

TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

I I I I I I I I I I I I I I I I I I I M i I I I I I I I M II I II II I I I M I I M M I 

TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 960 



TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I II I I I I I I 
961 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 



1020 



1125 



1184 



TTCTCTCTCTTG GAC ATT GAAC GT GT CT T TAAGGG GAAAT ACAAAGAGT T GAACAAAGAA 

I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II I I I I I I I II I II I I I I I I 

1021 TT CT CT CT CT T G GAC ATT GAACGT GT CT T TAAGGG GAAAT ACAAAGAGT T GAACAAAGAA 108 0 



1244 



1185 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 
M I I I I M I I I I I I I I I I M M I I I I M I I II I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
1081 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 114 0 

1245 GTGGGCCCCT C CT CT GAT AAGG C C C T GAC CT T CAT GAAGGAC CAT T T C C T GAT GGAT GAG 1304 

M I I I I I I II I I II I I I I I I I I I I I I II I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | 

1141 GTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAG 12 00 

1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

I I I M II II I M M M M M M I I II M I I I I I II I M || I 

12 01 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 12 60 

1365 GAGACAGC C C AGGG C CT T GAT GGG CACAGC CAT CTT GT CAT GT AC CT GGGAAC CACCAC A 1424 

M I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M Ml 

1261 GAGAC AG C C CAGGGC CTT GAT GGG CACAGC CAT CTT GT CAT GT AC C T GGGAAC CAGT AC A 132 0 

1425 GGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATT 1484 

I I I I I I I I I I I I M M I I I I I I M I I I M I I II I I I I I I I I I I I M I II I I I I I I II II I 
1321 GGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATT 1380 

1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

Ml II I I I II I I I I I I II I I I I I I I I I | | || | M I I II I I I I II I I I I I I || 

1381 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1440 

1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I I I I I I I I I I I I I I I I I I I I I I M I I I II II I I I II I I I I I I I I I I I I I I I I I M I I I I I 
1441 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1500 

1605 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1664 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1560 

1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

HI I I I I II I I I I II I I I I I I I I I I II I II II I I I II 

1561 CGACTCTGCTCTCT TAGGAACT C CT GGAAGCAGGACAT GGAGC GG 1605 

1725 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 1784 
I N I I I I I I I I I M II I I I I I I I I I II I I | I M I I I I M I II I I I | I | | | | | | | M M I I 



DO 


1606 


Qy 


1 / ob 


DO 


1666 


Qy 


1 o 4 o 


DO 


i nor 

1/26 


Qy 


iy uo 


Db 


178 6 


Qy 


1 o c c 

iy 6o 


Db 


184 6 


Qy 


O A O C 

Z UZO 


Db 


1906 


Qy 


o n o c 
Z U DO 


Db 


1966 


Qy 


z 14 o 


Db 


2026 


Qy 


zzOo 


Db 


o a o r 

2086 


Qy 


2265 


Db 


214 6 


A,, 

Qy 


O Q O R 

ZoZO 


Db 


2206 


Qy 


2385 


Db 


2266 



1606 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 1665 

CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 
I I I I I I I I I I I I I I I i I I I I I I I I I I ! I I I I I I I I I II I I I I I I I 1 | | || | | | | | | | | | 
CGCCCGCAAATCGTTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1725 

CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1904 
M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I | | I | | | | | | | || 
CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1785 

GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 
M I I I I I I I I I I I I I I | | | | | | I | | | | | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | | 

GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1845 

CTCTACCAGTGCTGGGC7UVCTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 1905 

GAC AGC CAGGAC C AGAC C CT GG CC CT GGAT C CT GAACT GGC AGGC AT C CC CC GGGAGC AT 2084 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAC AGC CAG GAC C AGAC C CT GGCC CT GGAT C CT GAACT G GC AG GCAT C CC C C GGGAGC AT 1965 

GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2025 

TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2085 

ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 22 64 
I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | M I I I I I I I I I I 
ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2145 

ACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAG 2324 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAG 2205 

GAAT GCAGGAC CT CT GC CAGT GAT GT G GAC G CT GACAACAACT GCCT AGGC ACT GAGGT A 2384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAT GCAGGAC CT CT GCCAGT GAT GT GGAC GCT GACAACAACT GCCT AGGC ACT GAGGT A 2265 



I I I I I I 



RESULT 12 

AX879068 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



AX879068 
Sequence 13973 
AX879068 
AX879068.1 GI : 



1838 bp DNA 
from Patent EP1074617. 

40033804 



linear 



PAT 17-DEC-2003 



Homo s apiens ( human ) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

FEATURES 

source 



CDS 



ORIGIN 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 

Ota,T., Isogai,T., Nishikawa, T . , Hayashi,K., Saito,K., Yamamoto,J., 
Ishii,S., Sugiyama,T., Wakamatsu, A. , Nagai,K. and Otsuki,T. 
Primers for synthesising full-length cDNA and their use 
Patent: EP 1074617-A 13973 07-FEB-2001; 
Research Association for Biotechnology (JP) 

Location/Qualifiers 

1. .1838 

/organism="Homo sapiens" 
/mol_type="unassigned DNA 11 
/db_xref="taxon: 9606" 
106. .1092 

/note="unnamed protein product" 
/ codon_start=l 
/protein_id="CAE90357 .1" 
/db_xref="GI : 40033805" 

/ translation= "MYLGTTTGSLHKAVVSGDSSAHLVEEIQLFPDPEPVRNLQLAPT 
QGAVFVGFSGGVWRVPRANCSVYESCVDCVLARDPHCAWDPESRTCCLLSAPNLNSWK 
QDMERGNPEWACASGPMSRSLRPQSRPQIIKEVLAVPNSILELPCPHLSALASYYWSH 
GPAAVPEASSTVYNGSLLLIVQDGVGGLYQCWATENGFSYPVISYWVDSQDQTLALDP 
E LAG I P REH VKVP LT RVS GGAALAAQQ S YW P H FVT VT VL FALVL S GAL 1 1 LVAS P L RA 
LRARGKVQGCETLRPGEKAPLSREQHLQSPKECRTSASDVDADNNCLGTEVA" 



Query Match 58.4%; Score 1834.8; DB 6; Length 1838; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1836; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 


1299 


GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 

1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 ! 1 1 I I I I | | | | | | | 

GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 


1358 


Db 


1 


60 


Qy 


1359 


GCAGT GGAGAC AGC C C AGGGCCTT GAT G GGC AC AG C CAT CT T GT CAT GT AC CT GG GAAC C 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GCAGT GGAGACAGC CCAGGGCCTT GAT GGGCACAGC CAT CTTGTCAT GTACCT GGGAAC C 


1418 


Db 


61 


120 


Qy 


1419 


ACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 
ACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAA 


1478 


Db 


121 


180 


Qy 


1479 


GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 
1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 


1538 


Db 


181 


240 


Qy 


1539 


GGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 
1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I I I I I I I I | | | | | | | | M | | | | | | | | | | | | | 
GGT GCAGT GTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 


1598 


Db 


241 


300 


Qy 

Db 


1599 
301 


GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 

III MINI 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 


1658 
360 



Qy 

Db 



1659 GAGT C C C GAAC CT GTT GC CT C CT GT CT GC C C C CAAC C T GAACT CC T GGAAGC AGGAC AT G 1718 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

361 GAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATG 42 0 



Qy 1719 GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 1778 

I I I I M I M I I I I I I I I I I t I I I I I I I I I I I I I I M I | | | | | | | | | | | | | || I I I I II I I 
Db 421 GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 4 80 

QY 1779 CAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTC 1838 

I I I I I I I I I I M I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGCTC 540 

Qy 1839 CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 1898 

M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 541 CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 600 

QY 1899 C CAGAAGC CT CTT CCACT GTCTACAAT GGCT C C CT CTT GCT GATAGT GCAGGAT GGAGTT 1958 

1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 601 CC AGAAG C CT CTT C C ACT GT C T ACAAT GGCTCCCTCTTGCT GATAGT GCAGGAT G GAGTT 660 

Qy 1959 GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 2018 

I M I I I I I I I I I I I I I I I I I I I I I I I | M I I I I I I I I I I I I II I I I I I | | | | | | | | | | | | 

Db 661 GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 72 0 

Qy 2 019 T GGGT G GACAGC CAGGAC CAGAC CCTGGCCCT GGAT C CT GAACT G GCAGGCAT C C CC C GG 2 078 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 T GGGT GGACAGC CAGGAC CAGAC CCTGGCCCT GGAT C CT GAAC T GGCAGGCAT C C C C C GG 780 

Qy 2079 GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 2138 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I II I I I I I I I I I II I I I | 

Db 781 GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 84 0 

Qy 2139 TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 2198 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | 
Db 841 TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 900 

Qy 2199 CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 2258 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 960 

Qy 2259 T GT GAGAC CCT GCGCC CT GGG GAGAAGGC C C C GT T AAGC AGAGAG CAACAC CT CC AGT C T 2318 

I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | 
Db 961 T GT GAGAC CCTGCGCCCT GGGGAGAAGG C C C C GT T AAGC AGAGAG CAACAC CT CCAGT CT 1020 

Qy 2319 C C CAAG GAAT GC AG GACCT CT GC C AGT GAT GT GGACGCT GACAACAACT G C CT AGGCACT 237 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | M I I I I I I I I I I | | | | | | | | | 
Db 1021 C C CAAGGAAT G CAGGAC CT CT GC CAGT GAT GT GGAC GCT GACAACAACTGC C T AGG C ACT 108 0 

Qy 2379 GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 2438 

I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | 

Db 1081 GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 1140 

Qy 2439 CT GGGC GGC CCAAGCACAGC C C T GACT AGGAT GAC AG CAGCACAAAAGAC C AC CT T T C T C 2498 

I I I I I II I I I I I II I I I I I I I I I | | I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I 
Db 1141 CTGGGC GGC C CAAGCACAGC C CT GACT AGGAT GACAG CAGCACAAAAGAC C AC CT T T CT C 1200 

Qy 2499 CCCT GAGAGGAGC T T CT GC TACT C T GCAT CAC T GAT GACACT C AGC AGGGT GAT GCACAG 2558 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 1201 CCCT GAGAGGAGCTTCTGCTACTCT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAG 1260 

Qy 2559 CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 2618 



M I I I I M I I I I I I I I I I I II I I I I I I | | | | | I I I I I I I | | | | | | | | | | | | | | [ | | | | | | 

1261 CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 132 0 



Qy 2619 GG G CT AC C C C CAGAC CT GC T C C T AC ACT GAT AT T GAAGAAC C T GGAGAG GAT C CT T C AGT 2678 

I I I I I i M I I M I I I I I M I I I I I I I I I I I II I I I I I I I II I I I I | | | | | | | | | || | | | | 
Db 1321 GG GCT AC C CC CAGAC C T G C T C C T AC ACT GAT AT T GAAGAAC CT GGAGAG GAT C CT T CAGT 1380 

2679 TCTGGCCATTCCAGGGACCCTCCAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGC 2738 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | 

Db 1381 T CT GGC C ATT C C AGGGAC C C T C C AGAAACACAGT GTT T CAAGAGAC C CT AAAAAAC CT GC 1440 

Qy 2739 CTGT CCCAGGACCCTATGGTAAT GAACAC CAAACATCTAAACAAT CATAT GCTAACAT GC 2798 

I I M M I I I M I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | | | | | | | | | | || 
Db 14 41 CT GT C C C AGGAC C CT AT GGTAAT GAACAC CAAACAT CTAAACAAT CATAT G CTAACAT GC 1500 

QY 2799 CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 2858 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1501 CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 1560 

Qy 2859 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 2918 

I I I M M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I II I I I I I I I I I I | | | | | | | 
Db 1561 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 1620 

Qy 2919 GGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 2978 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

Db 1621 GGAAGTCTTCCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 1680 

Qy 2979 CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 3038 

N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | | | | | | | | | | | 
Db 1681 CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 1740 

Qy 3039 CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 3098 

I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 1800 

Qy 3099 T CAGAGAC T GT T TAT T T T T TAT TAAAAAT AT AAGGCT T 3136 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | 
Db 1801 T CAGAGACT GT T TAT T T T T TAT TAAAAAT AT AAGGCT T 1838 



RESULT 13 

BD157628 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 



BD157628 1838 bp DNA linear PAT 17-JAN-2003 

Primer for synthesizing full-length cDNA and use thereof. 
BD157628 

BD157628.1 GI:27863386 
JP 2002191363-A/12471. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo, 
1 (bases 1 to 1838) 

Ota,T., Isogai,T., Nishikawa, T . , Hayashi,K., Saito,K., Yamamoto,J., 
Ishii,S., Sugiyama,T., Wakamatsu, A. , Nagai,K. and Otsuki,T. 
Primer for synthesizing full-length cDNA and use thereof 
Patent: JP 2002191363-A 12471 09-JUL-2002; 
HELIX RESEARCH INSTITUTE 



COMMENT 



FEATURES 

source 



ORIGIN 



OS 


Homo sapiens (human) 




PN 


JP 2002191363-A/12471 




PD 


09-JUL-2002 




PF 


28-JUL-2000 JP 2000280990 




PI 


TOSHIO OTA, TAKAO ISOGAI , TETSUO 


NISHIKAWA, KOJI HAYASHI , KAORU 


PI 


SAITO, 




PI 


JUNICHI YAMAMOTO, SHIZUKO ISHII, 


TOMOYASU SUGIYAMA, AI WAKAMATSU, 


PI 


KEIICHI NAGAI , TETSU JI OTSUKI 




PC 







C12N15/09,C07K14/47,C07K16/18,C12N1/15,C12N1/19,C12N1/21 / C12N5/ PC 
10, 

PC C12P21/02,C12Ql/68//C12P21/08,G06F17/30,C12N15/00,C12N5/00 CC 
Primer for synthesizing full-length cDNA and use thereof FH Key 
Location/Qualifiers 
FT CDS (106) . . (1089) . 

Location/Qualifiers 
1. .1838 

/ organism= ff Homo sapiens" 
/mol_type=" genomic DNA" 
/db xref="taxon: 9606" 



Query Match 58.4%; 
Best Local Similarity 99.9%; 
Matches 1836; Conservative 



Score 1834.8; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 1838; 



2; Indels 



0; Gaps 



0; 



Qy 


1299 


Db 


1 


Qy 


1359 


Db 


61 


Qy 


1419 


Db 


121 


Qy 


1479 


Db 


181 


Qy 


1539 


Db 


241 


Qy 


1599 


Db 


301 


Qy 


1659 


Db 


361 


Qy 


1719 


Db 


421 



GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 1358 
I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | | | || | | | | | | 
GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 60 

GCAGT GGAGAC AGC C CAGG G CCTT GAT GGGCAC AGCC AT CTT GT CAT GT AC CT GGGAAC C 1418 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I | I 
GCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACC 12 0 

ACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAA 147 8 
I I M I I I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I 
ACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAA 180 

GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 1538 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | | | | | | | | 
GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 24 0 

GGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 1598 

I M I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I M I I I I I 

GGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 



GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I 

GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 

GAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATG 

I I I I I I I M I I I I II I I I | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | | | | | | | 

GAGT C CC GAAC CTGTTGCCTCCTGTCTGCCCC CAAC CT GAACT C CT GGAAGC AG GACAT G 

GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 



300 



1658 



360 



1718 



420 



1778 



480 



Qy 


1779 


CAGAGC C GC C C GCAAAT CAT T AAAGAAGT C CT GGCT GT CC CCAACT C CAT C CT GGAGCT C 

| I 1 j 1 ii M 1 M 1 1 1 t i i if ii i t i i i i t i i i i i t i i i i i i i i i i i i i i iii 

1 1 1 1 1 ' 1 1 i 1 1 1 1 1 1 1 1 1 1 1 I I | | | | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | || | 

CAGAGC C GC C C GCAAAT CAT T AAAGAAGT C C T GGCT GT CC CT AACT CC AT C CT GGAGCT C 


1838 


Db 


481 


540 


Qy 


1839 


CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 

I 1 1 1 1 | i 1 || || | i i i i i i i i i i i i j i i i i ii i i i i i i i i i i i i i i i i , i , , , . 

1 1 ' 1 M i 1 M 1 1 I I I I ] j | | M | | | M I 1 II 1 M II I M I f | | M 1 1 1 1 1 M II 1 1 1 II 1 

CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 


1898 


Db 


541 


600 


Qy 


1899 


CCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTT 

Illlillllllllllllllllliii1111111111iji111111.il, 

1 1 1 1 'I 1 1 1 1 M 1 1 1 1 1 1 i 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I I I 1 | || | | | | | | | | | | | | 

C C AGAAGCC T CT T C CAC T GT C T ACAAT GGCTCCCT C TT GCT GAT AGT GC AGGAT GGAGT T 


1958 


Db 


601 


660 


Qy 


1959 


GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 

1 | | | | | | j i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i • i iii 

1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | | | | | | | | | | 

GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 


2018 


Db 


661 


720 


Qy 


2019 


TGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGG 

| | | | 1 1 1 1 1 1 1 1 1 1 1 I 1 1 M 1 1 1 I 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 > 

1 M I' 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 M 1 1 1 1 1 I || I I I I I || | | | | | | | | | | || | | | || | | | 

TGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGG 


2078 


Db 


721 


780 


Qy 


2079 


GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 

| | j | | | | | | | | | | | | | 1 1 1 1 1 1 1 1 ! 1 1 ! 1 I 1 1 1 I 1 I I I f I t I i i i i i i i 

1 1 I 1 1 1 1 1 1 1 1 M 1 1 II II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I M 1 1 1 II 1 
GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 


2138 


Db 


781 


840 


Qy 


2139 


TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 

1 1 1 1 1 M 1 M M l I M i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i tiii 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 II 1 1 I I | | 1 | 1 I | | | | | || | | || || | | | | || || | 

TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 


2198 


Db 


841 


900 


Qy 


2199 


CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 

1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i » t i i i i 
1 1 ' 1 ' 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II || | | || | | | 1 | | | | | | | | | | | | | | | | | || | | | 

CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 


2258 


Db 


901 


960 


Qy 


2259 


TGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCT 

| | | | | | | ! I | || | | | | | | | | | | | | | | 1 M 1 ! 1 1 | 1 1 1 ! | 1 1 1 1 1 1 | 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 'I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II II || I | | | | | | | | | | | | || | | | | | | 

T GT GAGAC CCTGCGCCCT GGGGAGAAGGC CC C GT TAAGCAGAGAGCAACAC CT C CAGT CT 


2318 


Db 


961 


1020 


Qy 


2319 


CC CAAGGAAT GCAGGACCTCT GC CAGT GATGT GGACGCT GACAACAACT GCCTAGGCACT 

1 1 1 1 1 1 1 1 1 1 1 l l l l l i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i > 

1 1 ■ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I I I I I | | | | | | | | 

CCCAAGGAAT GCAGGACCTCT GC CAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT 


2378 


Db 


1021 


1080 


Qy 


2379 


GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 

| | | | | | 1 | | | | | | | | | 1 | | j M | | | | | | | | | 1 | l | | 1 | [ 1 1 1 | | | | | 1 , . , 1 | , , 

■ 1 1 1 1 1 1 1 1 1 1 II 1 1 1 N 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I I | | | | | | | | | | | | | | | | || | | | | 
GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 


2438 


Db 


1081 


1140 


Qy 


2439 


CTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTC 

1 II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 I i i I I i I \ 

1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 II 1 II i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTGGGCGGCC CAAGCAC AGC CCT GAC TAG GAT GAC AGCAGCACAAAA.GAC CAC C T T T C T C 


2498 


Db 


1141 


1200 


Qy 


2499 


CCCT GAGAGGAGCTT CT GCTACT CT GCAT CACT GATGACACT CAGCAGGGT GAT GCACAG 

1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 
CCCT GAGAGGAGCTT CT GCT ACT C T GCAT CACT GATGACACT CAGCAGGGT GAT GCACAG 


2558 


Db 


1201 


1260 


Qy 


2559 


CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 

M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 


2618 


Db 


1261 


1320 



wy 




UD 


TOOT 

lozl 


uy 


^ o / y 


UD 


1 O O 1 

lool 


yy 


o n o o 


UD 


1 A A 1 

1441 


Qy 


^ / y y 


UD 


1501 


Qy 


xot»y 


Db 


1561 


Or* 

Qy 


2919 


Dd 


1621 


Qy 


o n *7 


DO 


T /" O T 

1681 


Qy 


o n o o 

3039 


Db 


1741 


Qy 


3099 


Db 


1801 



GGGC T AC CC C C AGAC CT GC T C C T AC AC T GAT AT T GAAGAACC T G GAGAGGAT C CT T C AGT 2678 
I M M I I I I I I I I I I I I I I I || || | | | I I | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | 
GGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGT 1380 

T CT GG C CAT T C CAGG GAC C CT C C AGAAACAC AGT GT T T CAAGAGAC C CT AAAAAAC CT GC 2738 

I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

T CT GG CC AT T C C AGGGAC C CT C C AGAAAC ACAGT GT TT CAAGAGAC C CTAAAAAAC CT GC 1440 

C T GT C CC AGGAC C CT AT GGTAAT GAACAC CAAACAT CTAAACAAT CAT AT GCTAACAT GC 2798 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C T GT C C C AG GAC C C TAT G GT AAT GAACAC CAAACAT C T AAAC AAT CAT AT G C T AAC AT G C 1500 

CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 2858 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 1560 

GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 2918 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I II II I I I I 
GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 1620 

GGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 297 8 

MM II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAAGTCTTCCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 168 0 

CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 3038 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 1740 

CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 3098 
I I I I I I I I I M M I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I I I I | I I I I I 
CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 1800 

T C AG AG AC T GT T TAT T T T T TAT T AAAAAT AT AAG G C T T 3136 
I I I I I I I I M I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
T CAGAGACT GT T T ATT TT TT AT T AAAAAT AT AAGGCT T 1838 



RESULT 14 

AK022349 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



AK022349 1838 bp mRNA linear PRI 01-AUG-2002 

Homo sapiens cDNA FLJ12287 fis, clone MAMMA1001771, moderately 
similar to M.musculus mRNA for semaphorin B. 
AK022349 

AK022349. 1 GI : 10433727 

oligo capping; fis (full insert sequence) . 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Isogai,T., Ota,T., Hayashi,K., Sugiyama,T., Otsuki,T., Suzuki, Y. , 
Nishikawa,T. , Nagai,K., Sugano,S., Shiratori, A. , Sudo,H., 
Wagatsuma,M. , Hosoiri,T., Kaku,Y., Kodaira,H., Kondo,H., 
Sugawara,M., Takahashi,M. , Chiba,Y., Ishida,S., Murakawa,K., 
Ono,Y., Takiguchi,S., Watanabe,S., Kimura,K., Murakami, K., 
Ishii,S., Kawai,Y., Saito,K., Yamamoto,J., Wakamatsu, A. , 
Nakamura,Y., Nagahari,K., Masuho,Y., Ninomiya,K. and Iwayanagi,T. 



TITLE NEDO human cDNA sequencing project 

JOURNAL Unpublished 
REFERENCE 2 (bases 1 to 1838) 
AUTHORS Isogai,T. and Otsuki,T. 
TITLE Direct Submission 

JOURNAL Submitted (23-AUG-2000 ) Takao Isogai, Helix Research Institute, 

Genomics Laboratory; 1532-3 Yana, Kisarazu, Chiba 292-0812, Japan 
(E-mail: genomics@hri.co.jp, Tel : 81-438-52-3975, Fax : 81-438-52-3986 ) 
COMMENT NEDO human cDNA sequencing project supported by Ministry of 

International Trade and Industry of Japan; cDNA full insert 
sequencing: Research Association for Biotechnology; cDNA library 
construction, 5 1 - & 3 ' -end one pass sequencing and clone selection: 
Helix Research Institute (supported by Japan Key Technology Center 
etc.) and Department of Virology, Institute of Medical Science, 
University of Tokyo. 
FEATURES Location/Qualifiers 
source 1. .1838 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/ db_xr e f = " t axon : 9 6 0 6 " 
/clone="MAMMA1001771" 
/tissue_type="Mammary gland" 
/ clone_lib= "MAMMA1 " 
/note="cloning vector: pME18SFL3" 
CDS 106. .1092 

/note="unnamed protein product" 
/ codon_start=l 
/protein_id="BAB14 018 .1" 
/db_xref="GI: 10433728" 

/ trans la tion="MYLGTTTGSLHKAVVSGDSS7^HLVEEIQLFPDPEPVRNLQLAPT 
QGAVFVGFSGGVWRVPRANCSVYESCVDCVLARDPHCAWDPESRTCCLLSAPNLNSWK 
QDMERGNPEWACASGPMSRSLRPQSRPQIIKEVLAVPNSILELPCPHLSALASYYWSH 
GPAAVPEASSTVYNGSLLLIVQDGVGGLYQCWATENGFSYPVISYWVDSQDQTLALDP 
E LAG I P REH VKVP LT RVS GGAALAAQ Q S YW P H FVT VT VL FAL VL S GAL 1 1 L VAS P L RA 
LRARGKVQGCETLRPGEKAPLSREQHLQSPKECRTSASDVDADNNCLGTEVA" 

ORIGIN 



Query Match 58.4%; Score 1834.8; DB 9; Length 1838; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1836; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 


1299 


GAT GAG CAAGT GGT GG G GACGCCCCTGCTGGTGAAATCTGGCGTGGAG TAT AC AC GGCTT 

1 1 1 M 1 1 t t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I i | | M | | | | | | | | | | | | | | | | | | | || || | | | | | | 

GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 


1358 


Db 


1 


60 


QY 


1359 


GCAGT GGAGACAGC C C AGGGC CT T GAT GGG C ACAGC CAT C TT GT CAT GT AC CT GGGAAC C 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 I I I I I I | | | | | | | | | | | | 
GCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACC 


1418 


Db 


61 


120 


Qy 


1419 


ACC AC AGGGT C GC T C CACAAGGCT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT G GAA 

1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAA 


1478 


Db 


121 


180 


Qy 


1479 


GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 

GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 


1538 


Db 


181 


240 



Ov 


X O O -7 


GGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 

I N 1 1 1 1 1 1 ! 1 1 1 1 1 1 I 1 I I I I | | | | | | | | | | | | | | | | | | | | | | | | | , || | ,, | | | || | | 

bbibUAblbl 1 1 bi AGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 


1598 


Db 


9 41 

ill 


300 


Ov 


X *J z> Zf 


GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 

M 1 1 1 1 1 II 1 1 1 1 1 1 1 I I 1 | 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 

biblAl bAbAbbl bTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 


1658 


Db 


OU1 


360 


Ov 

wy 




GAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATG 

1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I | | | | | | | | | 

bAbJ. bbbbAAbbl GrTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATG 


1718 


Db 


3 £1 

Jul 


420 


sly 


1 71 Q 

X / X J 


GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 

■ 1 1 1 I f > 1 1 1 f I ■ 1 I 1 1 1 J 1 J 1 I 1 f 1 1 1 1 1 1 1 1 1 1 i i II 1 1 1 1 1 MM II II 1 I 

bAbbbbbbbAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 


1778 


nh 

uu 




480 


D\7 


1 770 

± / / y 


CAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTC 

1 1 1 M 1 1 M M 1 1 II 1 II 1 1 II M M 1 1 1 1 1 1 1 II M II 1 1 || I I I I | | | M 1 1 1 1 1 1 1 

CAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGCTC 


1838 


nk 

UU 




540 


D\7 

wy 


1 ^ Q 


CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II 1 I I I 1 | | | | | | | | | | M | | | | | | | || || || | | 

UUU 1 GCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 


1898 


UU 


^4 1 
O *i ± 


600 


C\X7 

yy 


1 OQQ 

1 1) y y 


CCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTT 

1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

LCAGAAGCCTCTT CCACT GT CTACAATGGCT C CCTCTTGCT GATAGT GCAGGAT GGAGTT 


1958 


UU 


DUX 


660 


yy 


i y o y 


GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 

1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II II 1 
GbrbGGI Ul CTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 


2018 


UU 


Dux 


720 


H\7 

yy 


901 Q 

z u x y 


TGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGG 
1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I 1 1 1 1 1 1 1 1 I I 1 1 1 1 
IbrGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGG 


2078 


UU 


/ Z 1 


780 


wy 


9 m Q 
z u / y 


GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 

M M 1 1 1 M M 1 1 1 M 1 1 1 1 1 1 M M II 1 1 1 1 1 1 1 1 1 I I I | | | | | | | | | | | | | || 

GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 


2138 


UU 


/Ox 


840 


D\7 

wy 


Oi on 

z i o y 


TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 
M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I I I I | | | | | | | | | | | 
lUUlA^lbbrUOCCACI 1 1 GTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 


2198 


DH 


O fi X 


900 


wy 


91 QQ 

z ± y y 


CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ui UAJ. UAi LU1 Lb I GGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 


2258 


uu 


y u ± 


960 


flu 

yy 


zzoy 


TGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I | I I | | | I | | 
I bl b/AGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCT 


2318 


uu 


y d± 


1020 


Qy 


2319 


CCCAAGGAAT GC AGGAC C T CT GC C AGT GAT GT GGAC GCT GACAACAACT GC C TAG GCACT 
1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I I M 1 1 1 1 1 1 1 
CCCAAGGAAT GCAGGAC CT CT G C C AGT GAT GT GGAC GCT GACAACAACT GC C T AGGCAC T 


2378 


Db 


1021 


1080 


Qy 


2379 


GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 


2438 



Db 1081 



I I I > I I I I I i I I IN I I I I I I I I II I | M I I I I I I I I || | || || | | M I I II i I I 

GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 1140 



Qy 2439 CTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTC 2498 

I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | I I I I I I I I I I I I I I I I | | | | | | | | | | | | I I 
CTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTC 1200 



Db 1141 



Qy 2499 CCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGATGACACTCAGCAGGGTGATGCACAG 2558 

I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I | | | | | | | | I I I I I I I | | | I I I I I I I I I I I I 
CCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGATGACACTCAGCAGGGTGATGCACAG 



Db 1201 



1260 



Qy 2559 CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 2618 

" I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I 

CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 1320 



Db 1261 



Qy 2619 GGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGT 2678 

' I M I I I I II I I | | | | I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I | | | I I I I I I I I I I I 
GGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGT 



Db 1321 



1380 



Qy 2679 TCTGGCCATTCCAGGGACCCTCCAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGC 2738 

> > I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | I I I I I I I I I I I I I I I I I I I I 
TCTGGCCATTCCAGGGACCCTCCAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGC 1440 



Db 1381 



Qy 2739 CTGTCCCAGGACCCTATGGTAATGAACACCAAACATCTAAACAATCATATGCTAACATGC 2798 

" I I IN I I I I I I I I I I I I I I I I I I I I | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGTCCCAGGACCCTATGGTAATGAACACCAAACATCTAAACAATCATATGCTAACATGC 



Db 1441 



1500 



Qy 2799 CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 2858 

HI I I N I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I | | | | | | | | M I I I I I I 

CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 



Db 1501 



1560 



Qy 2859 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 2918 

I I I I 'I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I | 
Db 1561 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 1620 

Qy 2919 GGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 2978 

MINIMI I I I I I I I I I I I I I I | | | | | M I II II I I II III I Ml 

Db 1621 GGAAGTCTTCCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 1680 

Qy 2979 CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 3038 

I I I I I I I 'I II M II II I M M II II II II II || | || II II II II II I I II II II I II || 
CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 1740 



Db 1681 



Qy 3039 CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 3098 

I I I I I I I I II II M II I I I II || | M I II II M II II II I II I || I II II II II I 

CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 1800 



Db 1741 



Qy 3099 TCAGAGACTGTTTATTTTTTATTAAAAATATAAGGCTT 3136 

I I I I I I I M M II II I II || || || M II I II II I II II 
Db 1801 TCAGAGACTGTTTATTTTTTATTAAAAATATAAGGCTT 1838 



RESULT 15 
BC025800 

LOCUS BC025800 3159 bp mRNA linear ROD 12-NOV-2003 

DEFINITION Mus musculus sema domain, immunoglobulin domain (Ig) , transmembrane 
domain (TM) and short cytoplasmic domain, (semaphorin) 4A, mRNA 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



Abramson, R.D. 
McKernan, K. J. 
Worley,K.C. , 
Villalon,D.K. 



(cDNA clone MGC: 35988 IMAGE : 5102015 ) , complete cds 
BC025800 

BC025800. 1 GI: 19387926 
MGC. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus 
1 (bases 1 to 3159) 
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Diatchenko,L., Marusina,K., Farmer, A. A., Rubin, G.M., Hong,L., 
Stapleton,M. , Soares,M.B., Bonaldo,M. F. , Casavant , T . L . , 
Scheetz,T.E., Brownstein,M. J . , Usdin,T.B., Toshiyuki, S. , 
Carninci,P., Prange,C, Raha,S.S., Loquellano, N. A. , Peters, G. J., 
, Mullahy, S . J. , Bosak,S.A., McEwan,P.J., 
, Malek,J.A., Gunaratne, P . H . , Richards, S., 
Hale,S., Garcia, A.M., Gay,L.J., Hulyk,S.W., 
, Muzny, D.M. , Sodergren, E . J. , Lu,X., Gibbs,R.A., 
Fahey,J., Helton, E., Ketteman,M. , Madan,A., Rodrigues , S . , 
Sanchez, A., Whiting, M. , Madan,A., Young, A. C . , Shevchenko, Y. , 
Bouffard,G.G. , Blakesley, R. W. , Touchman, J. W. , Green, E.D., 
Dickson, M.C., Rodriguez, A.C., Grimwood,J., Schmutz,J., Myers, R.M., 
Butterfield,Y.S., Krzywinski,M. I . , Skalska,U., Smailus, D. E. , 
Schnerch,A., Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 

22388257 

12477932 

2 (bases 1 to 3159) 
Strausberg, R. 
Direct Submission 

Submitted (ll-MAR-2002) National Institutes of Health, Mammalian 
Gene Collection (MGC), Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 

Contact: MGC help desk 

Email: cgapbs-r@mail .nih. gov 

Tissue Procurement: Jeffrey E. Green, M.D. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Genome Sequence Centre, 

BC Cancer Agency, Vancouver, BC, Canada 

info@bcgsc.bc. ca 

Steven Jones, Jennifer Asano, Ian Bosdet, Yaron Butterfield, 
Susanna Chan, Readman Chiu, Chris Fjell, Erin Garland, Ran Guin, 
Letticia Hsiao, Martin Krzywinski, Reta Kutsche, Oliver Lee, Soo 
Sen Lee, Victor Ling, Carrie Mathewson, Candice McLeavy, Steven 
Ness, Pawan Pandoh, Anna-Liisa Prabhu, Parvaneh Saeedi, Jacqueline 
Schein, Duane Smailus, Michael Smith, Lorraine Spence, Jeff Stott, 
Michael Thorne, Miranada Tsai, Natasja van den Bosch, Jill Vardy, 
George Yang, Scott Zuyderduyn, Marco Marra. 



Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 57 Row: j Column: 12 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 7305468. 
FEATURES Location/Qualifiers 
source i. .3159 

/organism="Mus musculus" 
/mol_type= ll mRNA ,, 
/strain="FVB/N" 
/db_xref="taxon: 10090" 
/clone="MGC: 35988 IMAGE: 5102015" 

/tissue_type="Liver, normal. 5 month old male mouse." 

/ cl one__l ib= "NCI_CGAP_Li 9 " 

/labJiost="DH10B" 

/note="Vector : pCMV-SPORT6" 
gene 1. .3159 

/gene="Sema4a" 

/note=" synonym: SemB" 

/db_xref="LocusID: 20351" 

/db_xref="MGI: 107560" 
CDS 162. .2444 

/ codon_start=l 

/products "sema domain, immunoglobulin domain (Ig) , 
transmembrane domain (TM) and short cytoplasmic domain, 
(semaphorin) 4A" 
/protein_id="AAH25800. 1" 
/db_xref="GI: 19387927" 
/db_xref= M LocusID : 2 0351 " 

/translation="MALPSLGQDSWSLLRVFFFQLFLLPSLPPASGTGGQGPMPRVKY 
HAGDGHRALSFFQQKGLRDFDTLLLSDDGNTLYVGAREAVLALNIQNPGIPRLKNMIP 
WPASERKKTECAFKKKSNETQCFNFIRVLVSYNATHLYACGTFAFSPACTFIELQDSL 
L L P I L I D KVMD GKGQ S P FD P VH KHT AVL VD GML Y S GTMNN FL G S E P I LMRT L G S Q P VL 

KTDIFLRWLHADASFVAAIPSTQWYFFFEETASEFDFFEELYISRVAQVCKNDVGGE 
KLLQKKWTTFLKAQLLCAQPGQLPFNIIRHAVLLPADSPSVSRIYAVFTSQWQVGGTR 
S SAVCAFSLTDI ERVFKGKYKELNKETSRWTT YRGSEVS PRPGS CSMGPS SDKALTFM 
KDH FLMD EHWGT P L L VK S GVE YT RLAVE S ARGL D G S S HWMYL GTSTGSLH KAWP Q 

DSSAYLVEEIQLSPDSEPVRNLQLAPAQGAVFAGFSGGIWRVPRANCSVYESCVDCVL 
ARDPHCAWDPESRLCSLLSGSTKPWKQDMERGNPEWVCTRGPMARSPRRQSPPQLIKE 
VLTVPNSILELPCPHLSALASYHWSHGRAKISEASATVYNGSLLLLPQDGVGGLYQCV 
ATENGYSYPWSYWVDSQDQPLALDPELAGVPRERVQVPLTRVGGGASMAAQRSYWPH 
FLI VTVLLAI VLLGVLTLLLAS PLGALRARGKVQGCGMLP PRGKAP LS RDQHLQP S KD 
HRT S AS DVDADNNHLGAEVA" 
misc__feature 351. .1595 

/note="Sema; Region: Sema domain. The Sema domain occurs 
in semaphorins, which are a large family of secreted and 
transmembrane proteins, some of which function as 
repellent signals during axon guidance. Sema domains also 
occur in the hepatocyte growth factor receptor" 
/db_xref="CDD:pfam01403" 
misc_feature 1647. .1778 

/note="PSI; Region: domain found in Plexins, Semaphorins 
and Integrins" 
/db_xref="CDD: smart00423" 

ORIGIN 



Query Match 



56.0%; Score 1760; DB 10; Length 3159; 



Best Local Similarity 76.7%; Pred. No. 0; 

Matches 2356; Conservative 0; Mismatches 620; Indels 94; Gaps 13; 



Qy 


75 


• GAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCC 
III 1 I 1 1 1 1 1 1 III | | | | | | | | M | | | | | | | | | | | | | | | | | | || | | 

GAACCATCTGGTGACCATCTCAGGCTGACCATGGCCCTACCATCCCTGGGCCAGGACTCA 


134 


Db 


132 


. 191 


Qy 


135 


TGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 Ml | | 
TGGAGTCTCCTGCGTGTTTTTTTCTTCCAACTCTTCCTGCTGCCATCACTGCCACCTGCT 


194 


Db 


192 


251 


Qy 


195 


GCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGT 

) 1 ! ! II II 1 1 1 1 1 1 1 l l l i i i i i i r i i i i i i i i iiii t ■ 

1 111 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 IIII MM MM II II 1 1 

TCTGGGACTGGTGGTCAGGGGCCCATGCCCAGAGTCAAATACCATGCTGGAGACGGGCAC 


254 


Db 


252 


311 


Qy 


255 


AGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGT 

Kill II M 1 II 1 1 1 1 M M II II 1 1 II 1 M 1 II II 1 II II M II 1 1 II 1 1 

AGGGCCCTCAGCTTCTTCCAACAAAAAGGCCTCCGAGACTTTGACACGCTGCTCCTGAGT 


314 


Db 


312 


371 


Qy 


315 


GGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAG 


374 


Db 


372 


1 INN N M 1 II 1 II II 1 1 II II 1 1 II 1 1 Ml 1 1 M II II M II 1 II II 1 

GACGATGGCAACACTCTCTATGTGGGGGCTCGAGAGGCCGTCCTGGCCTTGAATATCCAG 


431 


Qy 


375 


GAT CC AG GG GT C C C CAGGCT AAAGAAC AT GAT AC C GT G GC C AGC C AGT GAC AGAAAAAAG 

1 II II 1 II M M 1 1 M 1 1 1 II II 1 II II 1 1 M 1 II 1 1 1 1 1 1 

AAC CCAGGAAT C C CAAGGCTAAAGAACAT GAT AC CCT GG C C AGC C AGT GAGAGAAAAAAG 


434 


Db 


432 


491 


Qy 


435 


AGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGACACAGT GTTT CAACT T C AT CC GT GT C 

1 1 1 1 1 M 1 1 1 II M M 1 1 1 M 1 M M 1 1 M 1 1 1 II II II 1 M 1 1 1 1 1 Ml 

ACCGAAT GT GCCTTTAAGAAGAAGAGCAAT GAGACACAGT GTTTCAACTTCAT T CGAGT C 


494 


Db 


492 


551 


Qy 


495 


CTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCT 

UNI HIM M M Mill II 1 1 1 1 1 1 1 1 1 I II M 1 1 II 1 M M 

CTGGTCTCTTACAATGCTACTCACCTCTATGCCTGTGGGACCTTTGCCTTCAGCCCTGCC 


554 


Db 


552 


611 


Qy 


555 


T GT AC CT T C ATT GAAC TT CAAGAT T C CT AC CT GT T GC C CAT CT C GGAG GACAAGGT CAT G 

1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I II 1 1 II II II 1 1 1 1 1 1 | M II II II M 

T GT AC CT T C ATT GAACTC CAAGAT T C C CT CCT GTT GC CCAT CT T GAT AGACAAG GT CAT G 


614 


Db 


612 


671 


Qy 


615 


GAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGAT 
H N N M 1 1 1 1 H M M 1 II II II 1 1 II 1 II I I M M 1 II 1 1 1 1 II 1 1 III 
GAC G GGAAGGGC CAAAGC C C CT TT GAC C CT GTT CACAAGCACACAGC T GT CT T GGT C GAT 


674 


Db 


672 


731 


Qy 


675 


GGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGC 

1 1 1 1 1 1 1 1 Mill II II 1 1 II II II 1 1 1 II 1 1 M II 1 II II 1 1 II II 1 II II II 

GGGATGCTTTATTCCGGCACCATGAACAACTTCCTGGGCAGCGAGCCCATCCTGATGCGG 


734 


Db 


732 


791 


Qy 


735 


ACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGAC 

1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 M II 1 1 II MM IIII 1 II || 1 II II M II 

AC ACT GGGAT CCCAGCCT GTTCT CAAGACTGACAT CTTCTT ACGCT GGCT GCAC GCGGAT 


794 


Db 


792 


851 


Qy 


795 


GCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACA 

1 1 1 1 1 II 1 II M II II 1 M II II 1 M 1 1 1 1 II 1 II II 1 II 1 1 II 1 II M 1 1 1 1 1 

GCCTCCTTCGTGGCAGCCATTCCATCCACCCAGGTCGTCTATTTCTTCTTTGAGGAGACA 


854 


Db 


852 


911 


Qy 


855 


GCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAG : 


914 



III 1 1 III II II Ill III I I II I 1 1 II 1 1 1 1 I II 1 1 1 1 1 1 1 



912 GCCAGCGAGTTTGACTTCTTTGAAGAGCTGTATATATCCAGGGTGGCTCAAGTCTGCAAG 971 



915 AATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAG 974 

N I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I II I I I II I 
972 AACGACGTGGGCGGTGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTCAAAGCCCAG 1031 

975 CTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTC 1034 

MINIM I MIM lllllllllll I I I I I I M MM MINIM ! Ill I IN 

TTGCTCTGCGCTCAGCCAGGGCAGCTGCCATTCAACATCATCCGCCACGCGGTCCTGCTG 1091 

CCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTT 1094 
MIIIMIIIIIIII I I I III I I I j 1 I 1 I f I | f | | | I II M II I I I I I I I I II I 
CCCGCCGATTCTCCCTCTGTTTCCCGCATCTACGCAGTCTTTACCTCCCAGTGGCAGGTT 1151 



1032 
1035 
1092 



1095 GGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTT 1154 
M I M I M I II I I II II M II I I I II I II I I I I I M II I || | || I II I I I II I 
GGCGGGACCAGGAGCTCAGCAGTCTGTGCCTTCTCTCTCACGGACATTGAGCGAGTCTTT 1211 



1152 



1155 AAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTACTTATAGGGGCCCT 1214 

M I I I I I II I I I III lllllll M II II I II II II I II II I II I I I | 
1212 AAAGGGAAGTACAAGGAGCTGAACAAGGAGACCTCCCGCTGGACCACTTACCGGGGCTCA 1271 

1215 GAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACC 1274 

„„„ 1 M "III II I I II II I II II I I I I II I || | | || I II I II I I II I 

1272 GAGGTCAGCCCGAGGCCAGGCAGTTGCTCCATGGGCCCCTCCTCTGACAAAGCCTTGACC 1331 



1334 



1275 TTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAA 

M M I M I I II II I I M I I II II M II II I I II I I I II II II I II I I I II I I I I 
1332 TTCATGAAGGACCATTTTCTGATGGATGAGCACGTGGTAGGAACACCCCTGCTGGTGAAG 1391 



1335 TCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGC 1394 

M M I Ml I I I II I II II II I I II II II I II I II I I II II I I MM 

TCTGGTGTGGAGTACACACGGCTTGCTGTGGAGTCAGCTCGGGGCCTTGATGGGAGCAGC 1451 



1392 
1395 



1454 



CATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGG 

M I I I M I II II Mill III I I I I II II II I II I II II I I | 

1452 CATGTGGTCATGTATCTGGGTACCTCCACGGGGTCCCTGCACAAGGCTGTGGTGCCTCAG 1511 
1455 GACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGC 1514 

1C1 I I I I I I I I I I I I MM Mill I I I I I I I I I F I I lllllll MM I I I I , I I [ 

1512 GACAGCAGTGCTTATCTCGTGGAGGAGATTCAGCTGAGCCCTGACTCTGAGCCTGTTCGA 1571 

1515 AACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGG 1574 

,„ I lllllllllll III Ml I II I II I II III I III II II III II II Mill Mill 

1572 AACCTGCAGCTGGCCCCCGCCCAGGGTGCAGTGTTTGCAGGCTTCTCTGGAGGCATCTGG 1631 

1575 AGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGG 1634 

M M II | || I II II II I I I II I II I II II II I II M I II 

AGAGTTCCCAGGGCCAATTGCAGTGTCTACGAGAGCTGTGTGGACTGTGTGCTTGCCAGG 



1632 
1635 
1692 



1691 



GACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAAC 1694 

M I M II I I M II I M I I II I Ml II I I II II I II I I I I 

GACCCTCACTGTGCCTGGGACCCTGAATCAAGACTCTGCAGCCTTCTGTCTGGCTCTACC 



1751 



1695 CTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGC 1754 

M I MMMI I MM II II I MUM II II 

1752 — - AAGCCTTGGAAGCAGGACATGGAACGCGGCAACCCGGAGTGGGTATGCACCCGTGGC 1808 



1755 CCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCT 1814 
I I I I I I I I I I I I I | | | | | | | | | | | | | Ml Ml | | | | | | | | | | | | | | | | | 

1809 CCCATGGCCAGGAGCCCCCGGCGTCAGAGCCCCCCTCAACTAATTAAAGAAGTCCTGACA 1868 

1815 GTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTAT 1874 
I I I I I I I I I I I I I I I I I I I | | | | | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | 

1869 GTCCCCAACTCCATCCTGGAGCTGCCCTGCCCCCACCTGTCAGCACTGGCCTCTTACCAC 1928 
1875 TGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTC 1934 

MIIMIIIIIII III I M lllllllllll I II IMIMIIIMII III II 

TGGAGTCATGGCCGAGCCAAAATCTCAGAAGCCTCTGCTACCGTCTACAATGGCTCCCTC 1988 



1929 
1935 
1989 
1995 
2049 
2055 
2109 
2115 



TTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGC 1994 
I I I I I I I I I I I I I I II II II I I I I I I II I I I II I IN I I I I I I I I III 
TTGCTGCTGCCGCAGGATGGTGTCGGGGGCCTCTACCAGTGTGTGGCGACTGAGAACGGC 2048 

TTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGAT 2054 
1 I I I I I I I I I I I I I I I II I I I I I I I | | | | | | | | | | | | | | | | | | | | I I I I | | | 

TACTCATACCCTGTGGTCTCCTATTGGGTAGACAGCCAGGACCAGCCCCTGGCGCTGGAC 2108 
CCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGT 2114 

I I I I I I I I II III I I I I | | | | | | MM II I I I II I M M I M II I I I II 

CCTGAGCTGGCGGGCGTTCCCCGTGAGCGTGTGCAGGTCCCGCTGACCAGGGTCGGAGGC 2168 
GGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTC 2174 

oico II II H M MM I I Ml I I I III Mill Mill III Ml II II II MM 

2169 GGAGCTTCCATGGCTGCCCAGCGGTCCTACTGGCCCCATTTTCTCATCGTTACCGTCCTC 2228 

2175 TTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTC 2234 

1 I I I I I I I I I Mil I I II I M M I II II I II I I I I II II 

2229 CTGGCCATCGTGCTCCTGGGAGTGCTCACTCTCCTCCTCGCTTCCCCACTGGGGGCGCTG 2288 



2235 
2289 
2295 



CGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTA 2294 

I I I M I M II I I II II II II I Ml I M I II I II I II I M II I 

CGGGCTCGGGGTAAGGTTCAGGGCTGTGGGATGCTGCCCCCCAGGGGAAAGGCTCCACTG 2348 



AGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTGCCAGTGATGTGGAC 2354 
Mill II II MINIM,' I I II II II I II I I I I II I I I M I I I I || || 
2349 AGCAGGGACCAGCACCTCCAGCCCTCCAAGGACCACAGGACCTCTGCCAGTGACGTAGAT 2408 

2355 GCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCT — 2412 
II M II II II I II M I I I I II I M I M I I Ml | | | 

GCCGACAACAACCATCTGGGCGCCGAAGTGGCTTAAACAGGGACACAGATCCGCAGCTGA 24 68 



2409 



2413 GCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGA 2472 

M I I I I II II I I II II II II I II 
2469 GCAGAGCAAGCCACTGGCCTTGTTGGCTATGC 2500 

2473 CAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACTG 2532 

IN I I I II | | | M | || | | M II II II II 

2501 — CAGGCACAGTGCCACTCTGACCAGGGTAGGAGGCTCTCCTGCTAACGTGTGTCACCT 2557 

2533 ATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCA 2592 

ocr I 'I' 'I' 'I' M II II II | | || I II I II II I I I 

2558 ACAGCACCCAGTAGG TCCTCCCCTGTGGGACTCTCTTCTGCAA 2 600 



Qy 2593 AG CACAT GAGCT CT CTAAC AGGGT G GGG GCT ACCC C CAGAC CT GCT C C TAC ACT GAT AT T 2652 

11111111 M I I I I I I I I I I I I 

Db 2601 GCACATT GGGCT GT CT C C AT AC CT GTACT T GT GCT GT GACA 



2641 



Qy 2 653 GAAGAAC CT G GAGAG GAT C CT T CAGT T CT G GCCAT T C CAG GGAC C C T CCAGAAACAC AGT 2712 

II I I II III I Ml II || Ml | MIMI I I I I I | 

GGAAGAGCCAGACAGGTTTCTTTGATTTTGATTGACCCAAGAGCCCTCCTGTAACAAACG 2701 



Db 2642 



Qy 2713 GTT T CAAGAGAC C C T AAAAAACCT GC CT GT C C CAG GAC C CTAT GGTAAT GAACAC CAAAC 2772 

1 I I I I I I I I I I 

Db 2702 T GC T C CAGGAGAC CAT GAAAG GTGTGGCTGTCT GGGATT CT GT GGT GACAAAC - CTAAG C 2760 



Qy 2 773 AT CTAAACAAT CAT AT GCTA ACATGCCACTCCTGGAAACTCCACTCT GA 2821 

III I Ml I Mil MIMI I I I I I I I 

ATCCGAGCAAGCTGGGGCTATTCCTGCAAACTCCATCCTGAACGCTGTCACTCTAGAAGC 



Db 2761 



2820 



Qy 2822 AGCTGCCGCTTTGGACACCAACACTCCCTTC-TCCCAGGGTCATGCAGGGATCTGCTCCC 2 880 

I I 1 I I I M M II I I I M I I I II I I I I I I I I I I i M I II Ml 

AGCTGCTGCTTTGAACACCAGCCCACCCTCCTTCCCAAGAGTCTCTATGGAGTTGGCCCC 



Db 2821 



2880 



Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I II HIMIIIIIIII III III I MMMI I I I I I I I I | | | 

Db 2881 TTGTGTTTCCTTTACCAGTCATGCCATACTGTTT— GGGAAGTCATCTCTGAAGTCTAA 2937 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT TCTGCCCTGGC-AGA 2996 

I I I M I I I I I I II M II M I M II II I I I I M I I II I I M I I M Ml 

Db 2938 CCACCTTCCTTCTTGCTTCAGTTTGGACAGATTGTTATTATTGTCTCTGCCCTGGCTAGA 2997 

Qy 2997 ATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTC 3056 

I I M M I I M II II I I M I I II I I I I | | | || || | | | | | 
Db 2998 ATGGGGGGCATAATCTGAGCCTTGTTCCCTTGTCCAGTGTGGCTGACCCTTGACCTCTT- 3056 

Qy 3057 CCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTT 3116 

M Ml I I I M II II I I II II M I I II I I II I M I I II II MM II I I M M 

Db 3057 -CCTTCCTCCTCCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCACAGACAATTTATTTT 3115 

Qy 3117 TTATTAAAAA 3126 

I II I I I I M I 
Db 3116 TTATTAAAAA 3125 
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SUMMARIES 



Result 



Query 



Mo. 


Score 


Match 


Length 


DB 


ID 


Description 


1 


3143 


100. 0 


3143 


3 


AAC58392 


Aac58392 Human 


2 


3143 


100. 0 


3143 


8 


ACD68436 


Acd68436 Novel 


3 


3143 


100.0 


3143 


8 


ACH04538 


Ach04538 Human 


4 


3143 


100. 0 


3143 


8 


ACD68082 


Acd68082 Novel 


5 


3143 


100.0 


3143 


9 


ADC18145 


Adcl8145 Human 


6 


3143 


100.0 


3143 


9 


ADD707 91 


Add7 0791 Human 


7 


3143 


100.0 


3143 


9 


ADD39868 


Add39868 Human 



PRO 
hum 
cDN 
hum 
PRO 
cDN 
cDN 





8 


3143 


100. 


0 


3143 


9 


ADD70314 


Add70314 


Human cDN 




9 


3143 


100. 


0 


3143 


9 


ADD38435 


Add38435 


Human cDN 




10 


3143 


100. 


0 


3143 


9 


ADD39391 


Add39391 


Human cDN 




11 


3143 


100. 


0 


3143 


9 


ADD38914 


Add38914 


Human cDN 




12 


3143 


100. 


0 


3143 


9 


ADD40345 


Add40345 


Human cDN 




13 


3143 


100. 


0 


3143 


9 


ADE50566 


Ade50566 


Human cDN 




14 


3143 


100. 


0 


3143 


9 


ADE20178 


Ade20178 


Human cDN 




15 


3143 


100. 


0 


3143 


9 


ADE50089 


Ade50089 


Human cDN 




16 


3143 


100. 


0 


3143 


9 


ADE21647 


Ade21647 


Human cDN 




17 


3131 


99. 


6 


3142 


3 


AAA37100 


Aaa37100 


Human PRO 




18 


3075 


97. 


8 


3075 


4 


AAF54397 


Aaf54397 


DNA encod 




19 


3041.4 


96. 


8 


3252 


9 


ADD67570 


Add67570 


Human Ly6 




20 


3040.8 


96. 


7 


3104 


5 


AAF45125 


Aaf45125 


Human TAN 




21 


3040.8 


96. 


7 


3104 


7 


ABX94103 


Abx94103 


cDNA enco 




22 


3040.8 


96. 


7 


3104 


7 


ACD66780 


Acd66780 


Secreted 




23 


3035.8 


96. 


6 


3191 


3 


AAC69084 


Aac69084 


Human sec 




24 


3029.8 


96. 


4 


3042 


4 


AAK53428 


Aak53428 


Human pol 




25 


3028.2 


96. 


3 


3042 


7 


ABX13628 


Abxl3628 


Human cyt 




26 


2860.4 


91. 


0 


3146 


7 


ACC69002 


Acc69002 


Human neu 




27 


2682.2 


85. 


3 


2981 


9 


ADB62165 


Adb62165 


Human cDN 




28 


2476.4 


78. 


8 


2768 


6 


ABS64946 


Abs64946 


Human cDN 




29 


2437 


77. 


5 


2745 


7 


ACC68985 


Acc68985 


Human neu 




30 


2283 


72. 


6 


2283 


5 


AAF45126 


Aaf45126 


Human TAN 




31 


2283 


72. 


6 


2283 


7 


ACD66781 


Acd66781 


Secreted 


c 


32 


2281 


72. 


6 


2281 


6 


AAD28945 


Aad28945 


Human MOL 


c 


33 


2281 


72. 


6 


2281 


9 


ADD18199 


Addl8199 


Human mol 




34 


2228.4 


70. 


9 


2271 


6 


AAD28944 


Aad28944 


Human MOL 




35 


2228.4 


70. 


9 


2271 


9 


ADD18197 


Addl8197 


Human mol 




36 


2104.8 


67. 


0 


2238 


7 


ACC69003 


Acc69003 


Human neu 




37 


1834 . 8 


58. 


4 


1838 


4 


AAH15636 


Aahl5636 


Human cDN 




38 


1727.6 


55. 


0 


3046 


5 


AAF45137 


Aaf45137 


Murine se 




39 


1727.6 


55. 


0 


3046 


5 


AAF45140 


Aaf45140 


Murine DN 




40 


1727.6 


55. 


0 


3046 


7 


ACD26369 


Acd26369 


Secreted 




41 


1727.6 


55. 


0 


3046 


7 


ACD26370 


Acd26370 


Secreted 


c 


42 


1714.8 


54. 


6 


1901 


4 


AAK53434 


Aak53434 


Human pol 




43 


1015.8 


32. 


3 


1674 


6 


ABK94920 


Abk94920 


Human nov 




44 


925.8 


29. 


5 


1730 


6 


ABS54021 


Abs54021 


cDNA enco 




45 


696.6 


22. 


2 


775 


4 


AAH04875 


Aah04875 


Human cDN 



ALIGNMENTS 



RESULT 1 
AAC58392 

ID AAC58392 standard; cDNA; 3143 BP. 
XX 

AC AAC58392; 
XX 

DT 29-JAN-2001 (first entry) 
XX 

DE Human PR01317 nucleotide sequence SEQ ID NO: 70. 
XX 

KW Human; tumour; diagnosis; neoplastic disease; neoplastic cell growth; 

KW proliferation; tumourigenesis ; identification; cancer; cytostatic; 

KW nootropic; neuroprotective; antiinflammatory; immunosuppressive; 

KW immunostimulant; antiangiogenic; leukaemia; lymphoid malignancy; 



KW neuronal disorder; glial disorder; astrocytal disorder; angiogenic; 

KW hypothalamic disorder; glandular disorder; macrophagal disorder; 

KW epithelial disorder; stromal disorder; blastocoelic disorder; 

KW inflammatory disorder; immunologic disorder; ss. 
XX 

OS Homo sapiens. 
XX 

PN WO200053755-A2. 
XX 



PD 


14 


-SEP- 


2000 






XX 












PF 


06 


-JAN- 


2000; 2000WO- 


-US000376. 


XX 












PR 


08 


-MAR- 


1999, 


; 99WO- 


-US005028. 


PR 


02 


-JUN- 


1999, 


? 99WO- 


•US012252. 


PR 


23 


-JUN- 


1999, 


f 99US- 


-0141037P. 


PR 


07 


-JUL- 


1999, 


; 99US- 


-0143048P. 


PR 


26 


-JUL- 


1999, 


99US- 


-0145698P. 


PR 


30 


-NOV- 


1999, 


99WO- 


US028313. 


PR 


20 


-DEC- 


1999, 


99WO- 


-US030911. 


PR 


05 


-JAN- 


2000, 


• 2000WO- 


-US000219. 



XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Ashkenazi A J, Baker KP, Goddard A, Gurney AL, Hillan KJ, Roy MA; 

PI Watanabe CK, Wood WI; 

XX 

DR WPI; 2000-572270/53. 

DR P-PSDB; AAB24084. 
XX 

PT Thirty PRO polynucleotides encoding PRO polypeptides, useful in the 

PT treatment, diagnosis and prevention of cancer. 

XX 

PS Claim 50; Fig 51; 286pp; English. 
XX 

CC The present invention describes an isolated antibody that binds to one of 

CC the human PRO proteins designated PR0212, PRO290, PR0341, PR0535, PR0619, 

CC PR0717, PRO809, PRO830, PR0848, PR0943, PRO1005, PRO1009, PRO1025, 

CC PRO1030, PRO1097, PRO1107, PROllll, PR01153, PR01182, PR01184, PR01187, 

CC PR01281, PR023, PR039, PR0834, PR01317, PRO1710, PRO2094, PR02145 OR 

CC PR02198. PRO antagonists can be used to inhibit tumour cell growth. The 

CC PRO polypeptides and nucleotides are useful in the treatment, diagnosis 

CC and prevention of cancer. The antibodies and other anti-tumour compounds 

CC maybe used to treat various conditions, including those characterised by 

CC overexpression and/or activation of the amplified PRO genes. Exemplary 

CC conditions or disorders to be treated with such antibodies and other 

CC compounds include benign or malignant tumours (e.g., renal, liver, 

CC kidney, bladder, breast, gastric, ovarian, colorectal, prostate, 

CC pancreatic, lung, vulva, thyroid, hepatic carcinomas, sarcomas, 

CC glioblastomas, and various head and neck tumours), leukaemias and 

CC lymphoid malignancies, other disorders such as neuronal, glial, 

CC astrocytal, hypothalamic and other glandular, macrophagal, epithelial, 

CC stromal and blastocoelic disorders, and inflammatory, angiogenic and 

CC immunologic disorders. AAC58242 to AAC58366 represent PCR primers and 

CC hybridisation probes used in the isolation of the human PRO sequences. 

CC AAC58367 to AAC58396 and AAB24057 to AAB24089 represent human PRO 

CC polynucleotide and protein sequences given in the exemplification of the 



CC present invention 
XX 

SQ Sequence 3143 BP; 656 A; 963 C; 828 G; 696 T; 0 U; 0 Other; 

Query Match 100.0%; Score 3143; DB 3; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I 
Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I II 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGG GGAT GAAC GT AGGGCACT TAGCT T CTT CC AC CAGAAG GGC CT C C AGGATT T T GACA 300 

I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I 

Db 241 CAGGG GAT GAAC GT AGGG CACT TAG CT T CTT C C AC CAGAAGGGCCT C C AGGAT T T T GACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTT GGAT AT CCAGGATCCAGGGGT CCCCAGGCTAAAGAACAT GATACCGT GGCCAGCCA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 361 C CT T G GAT AT CCAG GAT C CAG G GGT C C C CAGGCTAAAGAAC AT GAT AC C GT GGC CAGC C A 420 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAATGAGACACAGT GTTT CA 480 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CT T TAAGAAGAAGAGCAAT GAGACAC AGT GTTT C A 4 80 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I II I I I I I I I I I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGT CAT G GAGGGAAAAGGC CAAAGCC CCTT T GAC C C C GCT CACAAGC ATAC GG 660 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 

Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 



Db 


721 


C CAT C CT GAT G C GCACACT GG GAT C C C AGC C T GT C CT CAAGAC CGACAACTT CCT C C GC T 


780 


Qy 


781 


GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGArrrA^aTr^TrTAPTTrT 


ft A 0 
O ft u 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 I I I I I I I I | | | | | | | 1 | 




Db 


781 


GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 


840 


Qy 


841 


T CT T C GAGGAGAC AGC CAGC GAGT T T GACT T C TT T GAGAG GCT CC ACACAT CGCGGGTGG 


Zs u u 






1 1 1 i 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I I I I I I I I I | | | | | | | 




Db 


841 


TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 


900 


Qy 


901 


CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGArrArrT 








1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 


960 


Qv 


961 


TCCTGAAGGCCCAGCTGCTCTGCACCCAGCrGGGGrAGrTGrrrTTrAAPCTr ATrmrr 








1 M 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 I I I I 




Db 


961 


TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 


1020 


Ov 


1021 


ACGCGGTCCTGCTCCCCGCCGATTrTrr , rArAGrTrrrrArATrTArf;rA^:Tr r rTrarr r r 

nv^uvvju J- v^v^ x vj v^ x ^u^uuu^onJ. x v_* x v_* v_-v_-.rA.v^rV.vjv_» X v^\^U^riUrVl X .r\v^ vj\_/./-ivj 1^11 v_./\v_»v_. X 


1UOU 






1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1021 


ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 


1080 


Ov 


1081 


CCCAGTGGCAGGTTGGCGGGArrAGGAGrTrTGrrTrTTTTGTrTrrTTr r rr r nrTrTTr;r:ArA 

^vVw/nvj x vjia^>j-i,\jvj x x ^J l vJ\^>J'>Ju/i\_. v_-riuur).u^ X v_# x vj v_«> vjvj 1 1 loi vjV_< V-- X Xv_.Xv_.XV_,Xv_-X X ou/t.v>/t. 


x. x. % u 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 




Db 


1081 


CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 


1140 


Qv 


1141 


TTGTVACGTGTCTTTAAGGGGAAATACAAAGAGTTGAArAAAGAAArTTrArGrTGf^ArTA 

J- x vj.i xi iv_» vj x vj x \-r x x x nrvu vj vj wiuui x .r^.v^» .n^vn* vj.it. vj X X WilTlv^iuu^^iuulV.' X X VJ X VJ O/ivy X x\ 


i 9 nn 






1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


T T GAAC GT GT CT T T AAG GGGAAAT ACAAAGAGT T GAACAAAGAAACT T C AC GCT GGACT A 


1200 


Ov 


1201 


CTTATAGGGGCCCTGAGACCAACrrrrGGrrAGGrAGTTGrTrAGTGGGrrrrTrrTPTr^ 

\_r x x ji. x .fi.vj vj vj vj v_« v_^ x vJii\Jii.v^ v^rifiv v_» v_- v_» v_- vj vj v_» unu VJ V^JTJ.VJ X X VJ V^ X Vv.rt.VJ X VJ Vj VJ V_» V_^ V_» V_» X V_< V_* X v_» X VJ 


X.Z o u 






1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1201 


CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 


1260 


Ov 


1261 


ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGrAAGTGGTGGGGAPGr 

* " *-^J VJ W W^w X UiTiV* V_» X X wiX X VJZVt LVJ VJ.£kV_> \sl i. X X X V*- V. X VJ/ll VJVJJJ.X VJ^i.VJ \_r.tVZVVj X "JvJ X vJVJvJ7vJ.Ti.v_* Ovy 


1 u 






1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


ATAAG GCC CT GAC CT T CAT GAAGGAC C AT TT C C T GAT GGAT GAGCAAGT GGT G GGGAC GC 


1320 


Ov 


1321 


CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGPTTGrAGTGGAGArAGrrrAGGGnn 

*>"' v-« x uv> x v;vj x Viinni v_» x vjvj v_- vj x vjvj^vvj x ji. X Tivy/vv/ vjvj v_» X X Vj V^riw X VJ vJzi.vJxiv_.ji.vII v_» v_- ^jivj O vj v_> v_» 


X O O \J 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 I 1 1 1 I 




Db 


1321 


CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 


1380 


Ov 


1381 


TTGATGGGCACAGCCATCTTGTCATGTArrTGGGAArrArrAPAGGGTrGrTrr AP AAGH 

x x vJi^l vj vj vj vyr^v/ilvj v_» v_y^\ X v_. X X Vj X V»n.l Vj X X V3 U VJ/lriV/ vvrt v-i v_*^\.v_*^-\vjvjvj X v_*vjV_< X v>> vy/T.v>/lrt.v7 O 


i a a n 

X *i *i U 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 


1440 


QV 


1441 


CT GT GGTAAGT GGGGACAGCAGTGCT CAT CT GGT GGAAGAGATT CAGCT GTTCCCT GACC 

v x x \_j v_j j_ j, ii i.%_p x \_i \j \j vjj iv/i i-VJ v>^vvj x vj \_» x y~*J\ X v_< X VJ VJ X VJ VJilTlvJilvJii X X ^JiiU S — / X VJ X X V* v_» v_« X UXlV-i V_ « 


1500 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


C T GT GGTAAGT GG G GAC AGCAGT GCT CAT CT G GT GGAAGAGAT T CAGCT GT T C C C T GAC C 


1500 


Qy 


1501 


CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 


1560 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 


1560 


Qy 


1561 


CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 


1620 



1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 



Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCC CAAC C T GAACT CCT G GAAG C AG GACAT G GAGC GG GGGAAC CCAGAGT G GG 1740 

I I I I I I I I I I II I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I | I I I 
Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

Qy 1741 CAT GT G C CAGT G GC C C CAT GAGC AGGAGC CTTCGGCCT C AGAGC C GC C C G CAAAT CAT T A 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I i I 

Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I II I I I I M 
Db 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

Qy 18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAAT GGCT CC CT CTT GCT GATAGT GCAGGAT GGAGTT GGGGGT CT CTAC CAGT GCT GGG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 1981 CAACT GAGAAT GG CT TT T CAT ACC CT GT GAT CT C CTACT G GGT GGAC AGC C AGGAC C AGA 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 CAACT GAGAAT GGCT TT T CAT AC C CT GT GAT CT C CT ACT G GGT GGAC AGC CAG GAC C AGA 2040 

Qy 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 C C C T GG C CCT GGATC CT GAACT GGC AGGC AT C CC C C GG GAGCAT GT GAAGGT C C C GT T GA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I II I I I I I I 

Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAGG C CC C GTTAAGCAGAGAG CAACACCT CCAGT CT C C CAAGGAAT GC AGGAC CT CT G 2340 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 
Db 2281 AG AAG G C C C C G T T AAG CAG AG AG CAAC AC C T C CAGT C T C C C AAG G AAT G CAG GAC C T CT G 2340 

Qy 2341 C CAGT GAT GT G GACGCT GACAACAACT GC CT AGG CACT GAGGTAGCT T AAACT CT AGGC A 2400 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 24 00 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 



Qy 2461 T GAC TAGGAT GACAG C AGC ACAAAAGAC C AC CT TT CT C C C CT GAGAGGAGCT T CT GCT AC 2520 

I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 

Db 24 61 T GACTAGGAT GACAGCAGCACAAAAGACCACCTTT CT CCCCTGAGAGGAGCT T CTGCT AC 2520 

Qy 2521 T CT GCAT C ACT GAT GACACT CAGCAGGGT GAT G CACAGCAGT CT GC CT C C C CT AT GGGAC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I 1 II I I I I I I I I I I I I I I I I II I 
Db 2521 T CTGCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGTCT GCCT CCCCT AT GGGAC 258 0 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

I I I I I I I I ! I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

Qy 2641 T AC AC T GAT AT T GAAG AAC C T G GAG AG GAT C C T T C AGT T C T G G C CAT T C C AG G GAC C C T C 27 0 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 T ACACT GATATT GAAGAAC CT GGAGAGGATCCT T C AGTT CT GGCCATT CCAGGGACCCTC 27 0 0 

Qy 27 01 CAGAAACACAGT GTTT CAAGAGACC CTAAAAAACCT GCCT GT C CCAGGAC C CT AT GGT AA 2760 

I I 1 1 I II I I II I I I I I I I I I I I I I I i I II I I I I 1 1 1 1 1 1 I M I II I I I I I I I I I I I I I I I 

Db 27 01 CAGAAACACAGT GT T T CAAGAGAC C CT AAAAAAC C T GCC T GT CC C AGGAC C CT AT GGTAA 2760 

Qy 2761 T GAACAC CAAACAT CTAAACAAT CAT AT GCT AACAT GCCACT CCT GGAAACT CCACT CT G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 27 61 T GAACAC CAAACAT C TAAACAAT CAT AT GCT AACAT GCCACT C CT GGAAACT CCACT C T G 282 0 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 88 0 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I 1 1 I I I I I I I I I I I I I I I 

Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 30 01 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I i I I i I I I I I I I II I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAAT ATAAGGCT TAAAAAAA 3143 

RESULT 2 
ACD68436 

ID ACD68436 standard; cDNA; 3143 BP. 
XX 

AC ACD68436; 
XX 

DT 17-SEP-2003 (first entry) 



DE Novel human secreted and transmembrane protein PR01317 cDNA. 
XX 

KW Human; secreted and transmembrane protein; PRO; angiogenesis ; 

KW endothelial cell proliferation; wound healing; immune response; 

KW T- lymphocytes proliferation; neonatal heart hypertrophy; tumour; 

KW cardiac insufficiency disorder; calcium flux; inflammation; 

KW vascular endothelial growth factor-stimulated proliferation; 

KW mammalian kidney mesangial cell proliferation; Berger disease; 

KW nephropathy; Schanlein-Henoch purpura; celiac disease; Crohn's disease; 

KW dermatitis herpetiformis; diabetes; haemoglobin switch; insulinaemia; 

KW pancreatic beta-cell precursor cell differentiation; thalassemias; 

KW obesity; auditory hair cell regeneration; hearing loss; bone disorder; 

KW cartilage disorder; sports injury; arthritis; gene; ss. 

XX 

OS Homo sapiens. 
XX 

PN US2003073130-A1. 
XX 
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PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D , Desnoyers L, Eaton DL, Ferrara N, Fong S; 
PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 
PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 
PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-585293/55. 
DR P-PSDB; ABO33660. 
XX 

PT Novel isolated PRO polypeptides e.g. PRO1130, PR01275, PR01418, PR01555, 
PT PR01787 that modulate glucose or free fatty acid uptake by skeletal 
PT muscle cells, and are useful for treating diabetes, hyper- or hypo- 
Query Match 100.0%; Score 3143; DB 8; Length 3143; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 G GGCT GAG G CACT GAGAGAC C GGAAAGC CT GGCATT CC AGAG GGAG G GAAACGCAGC GG C 60 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I ! I I I I ! I I I I I I I ! I I I I I I I I I I I I II II I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 C AGGG GAT GAAC GT AGGGC ACT T AGC TT CT T C CACC AGAAGGGC CT C C AG GAT TT T GACA 300 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T G GAT AT C C AGGAT C C AG GGGT C C C CAGG CT AAAGAACAT GAT AC C GT G GC C AGC CA 42 0 

I I I II I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I I 

Db 361 C CT T G GAT ATC C AGGAT C CAGGGGT C C C CAGGCT AAAGAACAT GAT AC C GT GGC CAG C C A 420 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



421 GTGACAGAAAAAAGAGTGAATGTGCCTTTAAGAAGAAGAGCAATGAGACACAGTGTTTCA 4 80 

I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I ! II I I I I I I I I I M I II I I I I I I 1 I I I ! I 

421 GT GAC AGAAAAAAGAGT GAAT GT GC C T T T AAGAAGAAGAG CAAT GAGAC AC AGT GTT T CA 480 

481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

i I I I I I 1 I I 1 I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I II I 
541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

601 AGGACAAGGT CAT GGAGGGAAAAGGC CAAAGCCCCTTTGACCCCGCT CACAAGCAT AC GG 660 

I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 AGGACAAGGT CAT GGAGG GAAAAGGC CAAAGC CC CT T T G AC CC CGCT CACAAG CAT AC GG 660 

661 CTGTCTTGGTG GAT GGGAT GCT C T AT TCT G GT ACTAT GAACAACT T C CT GGGCAGT GAGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 

721 C C AT CCT GAT GC GCACACT GGGAT C C CAGC CT GT C CT CAAGAC CGACAACT TCCTCCGCT 7 80 

7 81 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

8 41 T CTT CGAGGAGACAGCCAGCGAGTTT GACTT CTTT GAGAGGCT C CACACAT C GCGGGT GG 900 

I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I ! I I I I 

841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

901 CTAGAGT CT GCAAGAAT GACGT GGGCGGCGAAAAGCTGCT GCAGAAGAAGT GGACCACCT 960 

I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 
901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

9 61 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I 
1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

1141 TT GAACGT GT CTTTAAGGGGAAAT ACAAAGAGTT GAACAAAGAAACTTCACGCT GGACTA 1200 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1141 T T GAAC GT GT C TT T AAG GGGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GC T GGAC T A 12 00 

12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

1261 ATAAGGCC CT GAC CTTCATGAAGGAC CATTTC CT GAT GGAT GAGCAAGT GGT GGGGAC GC 1320 
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I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

12 61 ATAAGGCCCT GACCTT CAT GAAGGACCATTTCCT GAT GGAT GAGCAAGT GGT GGGGACGC 132 0 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I! I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I 
1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

13 81 T T GAT G G G CAC AG C CAT CT T GT CAT GT AC CT GGGAAC CAC CAC AG GGTCGCTC C AC AAG G 144 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

1441 CT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCT GTT CC CT GACC 1500 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I II I I I I I I I I 1 I I 
1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1 62 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

1681 T GT CT G C C CC CAACCT GAACT CCT GGAAGC AG GACAT GGAGC GGGGGAAC C C AGAGT GGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 18 00 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

17 41 CAT GT GC C AGT GGCCC CAT GAGC AGGAGC CTT CGGC CT CAGAG CC GC C C GC AAAT CAT T A 18 00 

18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I 

1981 CAAC T GAGAAT GGCT TT T CAT AC C CT GT GAT CT C CTACT GGGT GGAC AG C C AGGAC CAGA 204 0 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 



Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

Qy 2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGT CT CCCAAGGAAT GCAGGAC CT CT G 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 22 81 AGAAGG C CC C GT TAAGC AGAGAGCAAC AC CT C CAGT CT C C CAAGGAAT GCAGGAC CT CT G 2340 

Qy 2341 CCAGT GATGTGGACGCT GACAACAACT GCCTAGGCACT GAGGTAGCTTAAACT CT AGGCA 2400 

I M I II I II I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2341 C CAGT GAT GT G GAC G C T G AC AAC AAC T G C C TAG G C AC T G AG GT AG C T T AAAC T C TAG G C A 2400 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2461 T GACT AGGAT GAC AGCAGC ACAAAAGAC CAC CTT T CT C C C CT GAGAGGAGCTT CT GCTAC 2520 

I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 

Db 2461 T GACTAGGAT GACAGCAG C AC AAAAGAC CACCTT T CT C CC CT GAGAG GAG CT T CT GCTAC 2520 

Qy 2521 T CT GC AT CACT GAT GACACT C AGC AG GGT GAT GC ACAG CAGT CT GC CT CC C CT AT GGGAC 2580 

I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 T CT GCAT CACT GAT GACACT CAGCAGGGTGAT GCACAGCAGT CT GCCT C CCCTAT GGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

Qy 2641 T AC ACT GAT AT T GAAGAAC CT GGAGAGGAT CC TT CAGT T CT GGC CATT CCAGGGACC CT C 2700 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 T ACACT GAT AT T GAAGAAC C T GGAGAGGAT C C TT C AGT T C T G GC CAT T C C AGGGAC C CT C 2700 

Qy 27 01 C AGAAAC AC AGT GT T T C AAGAGAC C C TAAAAAAC CTGCCTGTCC C AGGAC C CT AT GGTAA 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I 

Db 2701 CAGAAAC ACAGT GT T T CAAGAGAC C CTAAAAAAC CT GC CT GT C C CAG GAC C CT AT GGTAA 2760 

Qy 2761 T GAACACCAAACAT CTAAACAAT CAT AT GCTAACAT GC CACT CCT GGAAACT CCACTCT G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 27 61 T GAACAC CAAACAT CTAAACAAT CAT AT GCT AAC AT GC CACT C CT G GAAACT C CACT CT G 2820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 8 80 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 8 80 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

I I I I I I I I I I II I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I II I I I I I I II I I I I I I I I I I II II I I I II I I I I I I II I I I I I II I I I I I I I I I I I I I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 



Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I i I I I I I I I I i I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II II I I 1 I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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Human cDNA encoding 
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secreted/transmembrane protein PR01317. 



Human; ss; gene; secreted protein; transmembrane protein; PRO; vulnerary; 
cardiant; antidiabetic; anorectic; antiarthritic; angiogenesis ; cancer; 
adrenal cortical capillary; endothelial cell growth; wound healing; 
stimulated T-lymphocyte proliferation; immune response suppression; 
neonatal heart hypertrophy; cardiac insufficiency disorder; 
vascular endothelial growth factor; inflammation; mononuclear cell; 
eosinophil; diabetes; obesity; or hyper-insulinaemia ; hypo-insulinaemia; 
chondrocyte redif f erentiation; bone disorder; cartilage disorder; 
sports injury; arthritis. 
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Gaps 



QY 
Db 



1 GG GC T GAG GC AC T GAGAGAC C GGAAAGC CT GGCAT T C CAGAG G GAGG GAAAC GC AGCGGC 60 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I II I I I i I I I I I I I I I I 

1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 



Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 



Qy 


121 




"1 O 1 
XZ 1 


Qy 


181 


DJD 


1 o 1 


Qy 


241 


Db 


O A 1 


Qy 


301 


Db 


OAT 

Jul 


Qy 


361 


Db 


o ✓ — 1 

361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


A Q 1 
4 O 1 


Qy 


541 


Db 


541 


Qy 


601 


Db 


bul 


Qy 


661 


Db 


ool 


Qy 


721 


Db 


"7 O 1 


Qy 


781 


Db 


/ O 1 


Qy 


841 


Db 


841 


Qy 


901 


Db 


901 



TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I 1 I I I I I I I I 1 I I I I I I I I I I I II I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 
TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 1 I I I I I I I I I I I I I I I I I 
TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I 
CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

M I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

CCTT GGATAT C CAGGAT CCAGGGGTCCCCAGGCT AAAGAACAT GAT ACCGTGGCCAGC CA 42 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTT GGATAT C CAGGAT C C AGGGGT C C C CAGG CTAAAGAAC AT GAT AC C GT GGC C AGC CA 420 

GT GACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 4 8 0 

M I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I J I I I I I II I I I I I I I I I I I I I I I 

GT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 4 8 0 

ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I 
ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I 

CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

AGGACAAGGT CAT GGAGGGAAAAGG C CAAAGC CC CTTT GAC CC C GCT CACAAGCAT AC GG 660 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AG GACAAGGT CAT GGAGGGAAAAGGC CAAAGC C C CT T T GAC CC C GCT C ACAAG C AT AC GG 660 

CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I 
T C TT C GAG GAGACAG C CAGC GAGT T T GACT T CTT T GAGAG GCT C C AC ACAT C GC GGGT GG 90 0 

CTAGAGT CT GCAAGAAT GACGT GGGCGGCGAAAAGCT GCT GCAGAAGAAGT GGACCAC CT 960 
I I I I I I I I II II I II II I I I I I I I I 1 I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I 
CTAGAGT CT G CAAGAAT GACGT G GGC GG C GAAAAGC T GC T G CAGAAGAAGT GGAC C AC CT 960 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



9 61 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I 1 
961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I i t I I I I I I I I I I I 
1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

1141 T T GAAC GT GT CT TT AAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT GGACT A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I 

1141 T T GAAC GT GT CT TTAAGG GGAAAT ACAAAG AGTT GAACAAAGAAAC T T CAC GCT GGACT A 1200 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

12 61 ATAAGGCC CT GACCTT CATGAAGGACCATTT CCTGAT GGAT GAGCAAGT GGTGGGGAC GC 132 0 

I I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I M I I I I I I I I 

1261 ATAAGGC C CT GACCTT CAT GAAGGAC C AT TT CCT GAT GGAT GAG CAAGT G GT GGG GAC GC 132 0 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 138 0 

1381 T T GAT GGGCACAGC CAT C TT GT CAT GT AC CT GG GAAC CACC AC AG GGT C G CT C C ACAAGG 144 0 

I I I I I I I II I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 144 0 

1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I I I I I I I I i I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I II I I II I I I I I I I I II I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 C AGGAGGT GT CT GGAGGGT GC C C C GAGC CAACT GT AGT GT CTAT GAGAG CT GT GT GGACT 1 62 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I 
1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 162 0 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

1681 T GT CT GC CCCCAACCT GAACT CCT GGAAGCAGGACAT GGAGC GGGGGAAC CCAGAGT GGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 T GT C T G C C C C CAAC CT GAACT C CT GGAAGCAGGACAT GGAGC G GGGGAAC C C AGAGT GGG 1740 

1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 18 00 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I II I I I I I 
1741 CAT GT GCCAGT GGC C C CAT GAGCAGGAGC CT T C GGCCT C AGAG CC GC C C G CAAAT CAT T A 18 00 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 

Db 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I | | | I I M I | | I I I I I I I I I I I I t I I I I I I I I I I I II I I I I I I I I I I I I I I II I I i I I I I 
Db 1861 T GGC CT CT T AT TAT T GGAGT C AT G GC C CAG CAGC AGT C C CAGAAG C CT CT T C CACT GT CT 1920 

Qy 1921 ACAAT GGCTCCCTCTTGCT GAT AGT G CAGGAT GGAGTT G GGG GT CT CT AC CAGT GCT G G G 198 0 

I I M I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAAC T GAGAAT GGCT T T T CAT AC C CT GT GAT CT C CTACT GG GT GGAC AGC CAGGAC C AGA 2 040 

I | I I I I I I I | | I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 CAACT GAGAAT GGCT T T T CAT AC C CT GT GAT CT C CTACT GGGT GGAC AGC CAGGAC C AGA 204 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I II I I I I I M I II 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

II I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I II II I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 8 0 

Qy 22 81 AGAAGGCCCCGTT AAGCAGAGAGCAACAC CT CCAGT CT CCCAAGGAAT GCAGGACCT CT G 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II I I 

Db 22 81 AGAAGGCCCCGTT AAGCAGAGAGCAACAC CTC CAGT CT CC CAAGGAAT GCAGGAC CT CT G 2340 

Qy 2341 C CAGT GAT GT G GAC GCT GACAACAACT G C CTAGGC ACT GAGGT AGCT T AAACT CTAGGC A 2400 

II II I I I I M I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I 

Db 2341 C CAGT GAT GT GGAC GCT GACAACAACTGCCTAGGCACT GAGGT AGCT TAAACT CTAGGCA 2400 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I II I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2520 

I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 
Db 24 61 T GACTAGGAT GACAGCAGCACAAAAGACCACCTTT CTCC CCT GAGAGGAGCTT CTGCTAC 2520 

Qy 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GC CT CCCCTAT GGGAC 2580 

I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I 
Db 2521 T CT G CAT CACT GAT GACACT CAG CAG GGT GAT GCACAGCAGT C T GC CT C C C CTAT GGGAC 2580 

Qy 25 81 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2641 TACACT GATATTGAAGAAC CT GGAGAGGAT CCTT CAGTT CT GGCCATTCCAGGGACCCT C 27 00 

I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I M I II 



Db 



2641 



T ACAC T GAT AT T GAAGAAC CT GGAGAGGAT C CT T C AGT T CT GGC CAT T C C AGGGAC C CT C 



2700 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



2701 CAGAAACACAGT GT T T CAAGAGAC C CT AAAAAAC CT GC CT GT CC CAG GAC C CT AT GGT AA 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i II I I I I I I I I I I I II I 
2701 CAGAAACACAGT GT T T CAAGAGAC C CT AAAAAAC CT GCCT GT CC CAG GAC C CT AT GGT AA 2760 

27 61 T GAAC AC CAAAC AT CTAAACAAT C AT AT GCT AACAT GC C ACT CCT G GAAACT C CACT CT G 2 82 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I i I I I I I I I I I I I I I I I 

2761 T GAAC AC CAAACAT CTAAACAAT CAT AT G CT AACAT GCCACT CCT G GAAACT C CACT CT G 2820 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 880 

I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I 

2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 
I I I I I I I I I I I II II I I I I I I I I I 1 I I I I I II I I I I II II I I I I I I I I I I I I I I I I I I I I 

28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I II I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 
3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I Ml I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3 001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I II I I I I I I I I I I 
3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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ACD68082 standard; cDNA; 3143 BP. 
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DT 


17-SEP-2003 (first entry) 


XX 




DE 


Novel human secreted and transmembrane protein PR01317 cDNA. 


XX 
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Human; secreted and transmembrane protein; PRO; gene therapy; vaccine; 


KW 


tissue typing; chromosome identification; vaccine; gene; ss. 


XX 




OS 


Homo sapiens. 


XX 




PN 


US2003073129-A1. 


XX 




PD 


17-APR-2003. 


XX 




PF 


04-SEP-2001; 2001US-00946374 . 


XX 




PR 
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SEP- 
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SEP- 
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SEP- 


1998 


98US- 
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PR 


09- 
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1998 
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SEP- 
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? 98US- 
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SEP- 
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; 98US- 
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PR 
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SEP- 
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; 98US- 


0099602P. 


PR 


09- 


SEP- 
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\ 98US- 


0099642P. 


PR 
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SEP- 
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r 98US- 
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PR 
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SEP- 
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; 98US- 


0099754P. 


PR 
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SEP- 
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? 98US- 


0099763P. 
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XX 

PT Novel isolated PRO polypeptides e.g. PR01491 and PR01571, useful in the 

PT preparation of a medicament for treating a condition responsive to PRO 

PT polypeptide, and as therapeutic agents e.g. vaccines. 
XX 

PS Claim 2; Fig 157; 561pp; English. 
XX 

CC The invention describes an isolated PRO (secreted and transmembrane) 

CC polypeptide (I), having at least 80% sequence identity to a sequence 

Query Match 100.0%; Score 3143; DB 8; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I I II I I II I I I I I I I I I I I I ! I I I I I I I I I i II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GGGC T GAG GC ACT GAGAGAC C GGAAAGC CT GGCAT T C C AGAGGGAGGGAAAC GC AGCG GC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II Ml I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 3 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CTT G GAT AT CC AG GAT C C AGGGGT C C C C AGGCT AAAGAAC AT GAT AC C GT GGC C AG C C A 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CCTT GGAT AT CCAGGAT CCAGGGGT CCCCAGGCTAAAGAACAT GATACC GT GGC CAGCCA 42 0 

Qy 421 GT G ACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGACAC AGT GT T T C A 48 0 

I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I 

Db 421 GT GAC AGAAAAAAGAGT GAAT GT GC CT T TAAGAAGAAGAGC AAT GAGACAC AGT GT T T C A 48 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 



QY 
Db 



601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 AGGACAAG GT CAT G GAGGGAAAAGG C CAAAGC C C CT T T GAC C C CGCT C ACAAGC ATAC GG 
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1141 


Qy 


1201 


Db 


12 01 
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Db 


12 ol 
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1321 


dd 
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Qy 


1381 


Db 


1381 


Qy 


1441 


Db 


1441 



CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

I I I i I I I I I I I I I I I 1 I I I I ( I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

I | | I I I I I I I I I I I i I I I I It I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C CAT C CT GAT GC GC AC ACT G GGAT C C CAGC CT GT CCT CAAGAC C GACAACT TCCTCCGCT 780 

GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I | | | | I I I I I I I I I II I I I I t I I II I I I I I I I I I I I I II I I I i I I I I I I II I I I I I I I I I 

GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

T CT T C GAGGAGAC AGC CAG C GAGT T T GACT T C TT T GAGAGGCT C C AC ACAT C GC GGGT G G 900 

I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

T CT T C GAGGAGAC AGC CAG C GAGT T T GAC T T CTT T GAGAGG CT C C AC ACAT C G C GGGT G G 900 

CTAGAGT CT GCAAGAAT GACGT GGGCGGCGAAAAGCTGCT GCAGAAGAAGT GGACCACCT 960 

I | I I I 11 I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
CTAGAGT CT GCAAGAAT GAC GT GGGC GG C GAAAAGCT GCT GCAGAAGAAGT GGAC CAC CT 960 

TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 

ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

T T GAAC GT GT C T T T AAG GG GAAAT ACAAAG AGT T GAAC AAAGAAAC T T CAC GC T G GACT A 12 00 

I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

TT GAACGTGTCTTTAAGGGGAAAT ACAAAGAGTT GAACAAAGAAACTT CAC GCT GGACTA 12 00 

CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 

CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

AT AAGGC CCT GAC CTT CAT GAAGGAC CATT T C CT GAT G GAT GAG CAAGT GGT G GGGAC GC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I II I II I I 

AT AAG G C CCT GAC CT T CAT GAAGGAC CATT T C CT GAT G GAT GAG CAAGT GGT G G GGAC GC 1320 

CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

T T GAT GGGC ACAGC CAT CT T GT CAT GTACCT G GGAACC AC CACAGGGT C GCT C CACAAG G 1440 

I I I I 1 I II II I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

T T GAT GGG CAC AGC CAT CTT GT CAT GT AC CT G GGAACC AC C ACAG GGT C G C T C CACAAG G 1440 

CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 
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Db 
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Db 
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Db 
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Db 
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Db 
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Db 
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Db 

Qy 

Db 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I II I I I I I I I I I I I I i I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I i I I I 
1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 15 60 

1561 C AG GAGGT GT C T G GAGG GT GC C C CGAGC CAACT GTAGT GT CT AT GAGAGCT GT GT GGACT 1620 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGC CAACT GTAGT GTCTAT GAGAGCT GTGT GGACT 1620 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

1681 TGTCTGCCCC CAAC CT GAAC T C CT G GAAG C AGGACAT GGAGC GGGGGAACC C AGAGT GGG 174 0 

II I II II I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I M I 
1681 T GT CT GC CC CCAACCT GAAC T C CT G GAAG C AGGACAT GGAGC GG GG GAAC C CAGAGT GGG 1740 

1741 CAT GT GC CAGT GG C C C CAT GAG C AG GAG CCTTCGGCCT C AGAGC C G C C C GCAAAT CAT T A 1800 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I II II I I II I I I I I I I 
1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

I II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 192 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

1921 ACAAT GGCT CCCT CTT GCT GAT AGT GCAGGAT GGAGTT GGGGGT CT CTAC CAGT GCT GGG 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I 
1921 ACAAT GGCT CCCT CTT GCT GAT AGT GCAGGAT GGAGTT GGGGGT CT CTAC CAGT GCT GGG 198 0 

1981 CAACT GAGAAT GGCT TT T CAT AC C CT GT GAT CT C CT ACT GGGT GGAC AGCCAGGAC C AGA 204 0 

I I I I I I I I 1 I II I II I I I I I I I I I I I I II I I I I I I I I I II II I I I I I I I I II I I I I I I I I 
1981 CAACT GAGAAT GGCT T T T CAT AC C CT GT GAT C T C CTACT GGGT GGAC AGC CAGGAC C AG A 2040 

2041 CCCT GGC CCT G GAT C CT GAACT GGCAGGCAT C CC C CGGGAGC AT GT GAAGGT C C C GT T GA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 CCCT GGC CCT GGAT CCT GAACT GGCAGGCAT CCCCCGGGAGCATGT GAAGGT CCCGTTGA 2100 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I 
2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I 1 I I 1 I I I I I M II I I I I I I I I I 
2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

2281 AGAAGGC C C C GTT AAGCAGAGAG CAACACCT C CAGT CT C C CAAGGAAT G CAGGAC CT CT G 2340 

I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2281 AGAAGG C C C C GT T AAGC AGAGAGCAACAC CT C CAGT CT CC CAAGGAAT G CAGGAC C T CT G 2340 
2341 C CAGT GAT GT GGACGCT GACAACAACT GC CTAGGCACT GAGGTAGCT TAAACT C T AG GC A 24 00 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I i I I I I I I I I I I I I I I I I I I I I I I I 
2341 C C AGT GAT GT G GAC G CT GACAAC AAC T GCCTAGG CACT GAGGT AGCT T AAACT C T AGGCA 24 00 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

2461 T GACT AGGAT GAC AGCAGC ACAAAAGAC CAC CTT T CT C C C CT GAGAGGAGCTT CT GCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
2461 T GACT AG GAT GAC AGCAGC ACAAAAGAC CACCTT T CT C C C CT GAGAGGAGCTT CT GCTAC 2520 

2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GC CT CCCCT AT GGGAC 2580 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

2521 T C T GCAT CACT GAT GACACT CAGCAGGGT GAT GC AC AG C AGT CT GC C T C C C CT AT GGGAC 2580 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I I I II I I I i I I I I I II I I I I I I I II I I I I i I I I I I I I M I I M I I I I I I I I I I I I 
2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

2641 T ACACT GAT AT T GAAGAAC CT GGAGAG GAT CCTT CAGTT CT GGCCAT T C CAG GGAC C CT C 27 00 

I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

2641 T ACACT GAT AT T GAAGAAC CT G GAGAGGAT C CTT CAGTT CT GGC C AT T C CAG GGAC C CT C 27 00 

2701 CAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCT GCCT GTCCCAGGACCCTATGGTAA 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I I I I 
2701 C AGAAACAC AGT GTT T CAAGAGAC C CTAAAAAAC CT GC CT GT CC C AGGAC C CT AT GGT AA 27 60 

27 61 T GAAC AC CAAACAT CT AAACAAT CAT AT GCT AAC AT GC CACT CCT GGAAACT CCACT CT G 2820 

I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I 

2761 T GAAC AC CAAACAT CT AAACAAT CAT AT GCT AAC AT GC CACT CCT GGAAACT C CACT CT G 2820 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 8 0 

I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 

2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 8 0 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 8 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 
3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I M I I I I II I I I I I I I I I I I I I 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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ID ADC18145 standard; cDNA; 3143 
XX 
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DT 18-DEC-2003 (first entry) 
XX 

DE Human PRO polynucleotide #79. 
XX 

KW Human; PRO; gene; ss; protein 
KW gene mapping; genetic disorder 
XX 

OS Homo sapiens. 
XX 

PN US2003064925-A1. 
XX 
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PA (GETH ) GENENTECH INC. 
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PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-555602/52. 

DR P-PSDB; ADC18146. 
XX 

PT Novel isolated PRO polypeptides e.g. PR01491 and PR01571, useful in the 

PT preparation of a medicament for treating a condition responsive to PRO 

PT polypeptide, and as therapeutic agents e.g. vaccines. 
XX 

PS Claim 2; SEQ ID NO 276; 555pp; English. 
XX 

CC The invention relates to human PRO polypeptides and the polynucleotides 

CC encoding them. The sequences are useful in the preparation of a 

CC medicament for treating a condition responsive to a PRO polypeptide. The 

CC polypeptides are useful in a number of functional biological assays, as 

CC molecular weight markers for protein electrophoresis and as therapeutic 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I I I I I I I I I i I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I II 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I t 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I I I I I I I I I I I I I I I i I I I I I I I I I I t II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

Qy 2 41 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 30 0 

I I I I I I I I 1 I I I I I I I I I I I 1 I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 30 0 



Qy 



301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T G GAT AT C C AGGAT C C AG GGGT C C C CAG GCT AAAGAAC AT GAT AC C GT GG C C AG C CA 420 

I I I I I I I I 1 I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I 1 I I I II I I I I I I I 

Db 361 C CT T GGAT AT C C AGGAT C C AGG GGT C C C CAGGCTAAAGAAC AT GAT AC CGT GG CCAGC C A 420 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGAC ACAGT GTT T C A 4 80 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GCCTT TAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 4 80 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTAC7VATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 481 ACT T CAT C CGT GT C CT G GTTT CT T ACAAT GT C AC C CAT CT CT ACAC CT G C GGC AC CT T C G 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I II I I II M II I I I I I M I I II I I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGT C AT GGAGGGAAAAGGC CAAAGC C C C TT T GAC CCC GCT CACAAGCAT AC GG 660 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I 

Db 601 AGGACAAGGT CAT GGAGGGAAAAGGC CAAAG C C C CT T T GAC C C C GCT CACAAGCAT AC G G 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I II I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 C CAT C CT GAT GC G C AC ACT GGGAT C C CAG CCTGTCCT CAAGACC GACAACT TCCTCCGCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 721 C CAT C CT GAT GC G CAC ACT GG GAT C C C AGC CT GT C CT CAAGAC C GAC AACT T C CT CC GCT 7 80 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 8 40 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 9 00 

I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 T CT T C GAG GAGAC AGC C AGC GAGT T T GACTT CT T T GAGAGGCT C CAC AC AT C G CGGGT G G 900 

Qy 901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 901 CTAGAGT CT GCAAGAAT GACGT GGGC GGCGAAAAGCT GCT GCAGAAGAAGT GGAC CACCT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I II I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I II I I I I I I I I I I I I 

Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

Qy 1141 T T GAAC GT GT CT TT AAGGGGAAAT ACAAAGAGT T GAACAAAGAAAC T T CAC GCT GGACTA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1141 T T GAAC GT GT CT TT AAGGGGAAAT ACAAAGAGT T GAACAAAGAAACTT C AC GCT G GACTA 1200 



Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I 

Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ATAAGG C C CT.GAC CT T CAT GAAG GACCAT TT C C T GAT GGAT GAG CAAGT G GT GG GGAC GC 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 138 0 

Qy 1381 TT GAT GGGCACAGCCAT CTT GT CAT GTACCT GGGAACCAC CACAGGGT C GCT CCACAAGG 144 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 TT GAT GGGCACAGC CAT CTTGT CAT GT AC CT GGGAACCAC CACAGGGT CGCT CCACAAGG 144 0 

Qy 1441 CT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT CAGCT GTT CC CTGACC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1441 CT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT CAGCT GTT CCCT GACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I II I I I I I I I I 1.1 I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 C AGGAG GT GT CT G GAG GGT GC C C C GAGC C AACT GT AGT GT C TAT GAGAGC T GT GT GGACT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

Qy 1741 CAT GT G CCAGT G GC C C CAT GAG CAGGAGC CT T C GG CCT C AGAGC C GC C C G CAAAT CAT T A 180 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CAT GT G CCAGT GGC C C CAT GAG CAGGAGC CT T C GGC CT C AGAG C C G C C C GCAAAT CAT T A 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAACTGAGAATGGCTTTT CATACCCT GT GAT CT CCTACT GGGT GGACAGCCAGGACCAGA 2 040 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 CAACT GAGAAT GG CT TT T CAT AC C CT GT GAT CT C CTACT GGGT GGAC AGC CAGGAC C AGA 204 0 



Qy 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 



Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 8 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAGGCC CC GTT AAGCAGAGAGCAACACCT CCAGT CT C CCAAGGAAT GCAGGACCT CT G 2340 

1 1 1 1 1 1 1 1 II I i 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 I 

Db 2281 AGAAGGCC CC GT TAAGC AGAGAGCAACACCT C CAGT C T C C CAAGGAAT G C AGGAC CTC T G 2340 

Qy 2341 C CAGT GAT GT GGAC GCT GACAACAACT G C C T AGGC ACT GAGGT AG CT TAAAC T CT AGGC A 2400 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I 

Db 2341 C C AGT GAT GT GGAC GCT GACAACAACT GCCT AGGC ACT GAGGT AG CTTAAACTCTAGGC A 2400 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2461 T GAC T AGGAT GAC AGCAGC ACAAAAGACCAC CT T T C T C C C CT GAGAGGAGCT T CT GCT AC 2520 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I II I I I I I I 
Db 2461 T GAC T AGGAT GAC AGCAGCACAAAAGAC CAC CTT T CT CC C CT GAGAG GAGCT T CT GCT AC 2520 

Qy 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGC AGT CT GCCT C C C CT AT GGGAC 2580 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I II II I I I I I I I II I I II II 

Db 2521 T CT GC AT CACT GAT GACACT CAG C AGGGT GAT G C ACAG CAGT CT G CCT CC C CTAT GGGAC 25 8 0 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

I I I I I i I I I I I I I I I II I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

Qy 2641 TACACT GAT ATTGAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCATT CCAGGGACCCT C 2700 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I 
Db 2 641 TACACT GAT AT T GAAGAAC C T GGAGAGGAT CCT T C AGTT CT GGC C AT T C CAG GGAC C C T C 27 00 

Qy 2701 CAGAAACAC AGT GT T T CAAGAGAC CCTAAAAAAC CT G C CT GT C CCAG GAC C C T AT GGT AA 2760 

I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 CAGAAACAC AGT GTT T CAAGAGAC C CT AAAAAAC CT GCCTGTCC CAGGAC C CT AT GGT AA 2760 

Qy 2761 T G AAC AC C AAAC AT C T AAAC AAT CAT AT G CT AAC AT G C CAC T C C T G G AAACT C CAC T C T G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 T GAACACCAAACAT CT AAACAAT CAT AT GCT AACAT GCCACT C CT GGAAACT CCACTCT G 2820 

Qy 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I I I I II I II 
Db 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

Qy 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 



Db 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

Qy 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I II I I 1 I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3 001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 314 3 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-874602/81. 

DR P-PSDB; ADD70792. 
XX 

PT Novel isolated PRO polypeptides e.g., PRO1130, PR01275, PR01418, PR01555, 

PT PR01787 affect glucose or free fatty acid (FFA) uptake by skeletal muscle 

PT cells and are useful for treating diabetes or hyper- or hypo-insulinemia . 
XX 

PS Claim 2; SEQ ID NO 276; 553pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
Qy 1 GG GCT GAGGCACT GAGAGACC GGAAAGC CT GGC AT T C CAGAGGGAGG GAAAC GCAGC GG C 60 



Db 



I I I I I I I 1 I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I ! I I I I I I 
1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 



Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I II I I I I I I I I I I I i I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I 1 I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 T GC C GAC GAC GAC CG C G GGGGGAG G C GG GC AGGG GC CC AT GC C CAG GGT C AGATACT AT G 24 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I i I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 241 C AGGGGAT GAAC GTAGG GCACT T AG CTT CT T C CACCAGAAGGGC CT C CAGGAT TT T GAC A 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I II I I! I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T G GAT AT C CAGGAT C CAG GGGT C C C CAGG CT AAAGAACAT GAT AC C GT GGC C AGC C A 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 C C T T GGAT AT C CAGGAT C C AGGGGT C C C CAGG CT AAAGAACAT GAT AC C GT G GCC AGCCA 420 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAG CAAT GAGACACAGT GTT T C A 4 80 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT GAGACACAGT GTTTCA 4 80 

Qy 481 ACT T CAT C C GT GT C CT GGT T T C T T ACAAT GT C AC CCAT CT CT AC AC CT GC G GCAC CT T C G 54 0 

I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 C CT T C AGC C CT GCT T GT AC CTT CAT T GAACT T CAAGAT T C CT AC CT GT T GC C CAT CT C G G 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AG GACAAGGT CAT GGAGGGAAAAGGC CAAAGC C C CT TT GACC CCGCT CACAAG CATAC GG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I II I I I I I I 
Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 C CAT C CT GAT GC GCAC AC T GGGAT C C C AGC CT GT C C T CAAGAC C GAC AAC TTCCTCCGCT 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 721 C CAT C CT GAT GC G C AC ACT GG GAT C C CAGC CT GT CCTCAAGAC C GACAACTT C CT C C GCT 780 

Qy 7 81 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I II I I I I I I I I I II I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 7 81 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 T CT T C GAGGAGACAGC C AG C GAGT T T GACT T CT T T GAGAG GCT C CACAC AT CGCGGGTGG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 841 T CT T C GAG GAGAC AG C CAG CGAGT T T GACT T CTT T GAGAGGCT CCAC AC AT CGCGGGTGG 900 

Qy 901 CTAGAGT CT GCAAGAAT GACGT GGGC GGCGAAAAGCTGCT GCAGAAGAAGT GGAC CACCT 960 

I I I I I 11 I I I I I I I I I I 11 1 I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 

Db 901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I II I I I I I I I I I I I I 1 I I I I I I I I I I I I I 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 10 81 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I 

Db 10 81 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

Qy 1141 TT GAACGT GT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTTCACGCT GGACTA 1200 

I I I I I I I II I I I I I I I I I I I I II I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1141 TTGAACGTGT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTTCACGCT GGACTA 1200 

Qy 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 12 61 AT AAGGCC CT GAC CT T CAT GAAGGAC CATT T C CT GAT GGAT GAGCAAGT GGT GGGGAC GC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AT AAGGCC CT GACCTTCAT GAAGGAC CATTTCCT GAT GGAT GAGCAAGT GGT GGGGAC GC 132 0 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 

Db 1381 T T GAT GG GC AC AGC CAT CT T GT C AT GTACCT GG GAAC CAC CACAGGGT C G CT C C ACAAGG 144 0 

Qy 1441 CT GT GGTAAGT GGGGACAG CAGT GCT CAT CT G GT GGAAGAGAT T CAGCT GTT C C CT GAC C 1500 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1441 CT GT GGTAAGT GGGGACAG CAGT G CT CATCT G GT G GAAGAGATT C AG CT GTT CC CT GAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 1 II I I I I I I I I I I I II I I I I I I I I I I 

Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I M I 
Db 1561 CAGGAGGT GT C T GGAGG GT GC C C C GAGC CAACT GT AGT GT CTAT GAGAGCT GT GT GGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I 1 1 I I I I i I I I 1 1 I I I I I I I I I 1 1 1 1 I I II I I I I I 1 1 I I I 1 1 I I I I I II I I I I I I I I I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1681 TGTCTGCCCC CAACCT GAACT C CT GGAAGCAGGAC AT GGAGC GGG G GAAC CC AGAGT GGG 174 0 



Qy 1741 CAT GT G CCAGT GG C C C CAT GAGC AGGAGC CTTCGGCCT C AGAGC C G C C C G CAAAT CAT T A 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I ! I I I I i I I I 

Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I II I I I I I I I I I I I I M I I i I I ! I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 18 61 TGGCCTCT T ATT AT T GGAGT CAT GG C C C AGC AG CAGT C C CAGAAGC C T CT T C C ACT GT CT 1920 

I I I I I I I I I I I I i I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T G GC CT CT T ATT AT T GGAGT CAT G GC C C AGC AGCAGT C C C AGAAG C CT C T T C CACT GT CT 192 0 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 1981 CAACT GAGAAT GGCTTTT CAT AC C CT GT GAT CT CCTACT GGGT GGACAGCCAGGACCAGA 2040 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I 

Db 1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 204 0 

Qy 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II I I I I I I I I I I II I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

Qy 22 81 AGAAGGC C CC GT TAAGCAGAGAGCAACAC CT C CAGT CT C CCAAGGAAT GC AGGAC CT CT G 234 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 81 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 234 0 

Qy 2341 CCAGT GAT GT GGAC GCT GACAACAACT GC CT AGGCACT GAG GT AGCT TAAACT C T AGG CA 24 00 

I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCAGT GAT GT GGAC GCT GACAACAACT GC CT AGGCACT GAGGT AGCT TAAACT CTAGGC A 24 00 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 2461 T GACT AGGAT GACAGCAGC ACAAAAGAC CAC CTTT CTCCCCT GAGAGGAGCTT CT GCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
Db 2461 T GACT AGGAT GACAG C AGCACAAAAGAC CAC CT T T CT CC C CT GAGAGGAGCTT CT GCT AC 252 0 

Qy 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGC AGT CT G C CT C C C CT AT GGGAC 258 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 T CT GCAT CACT GAT GACAC T C AGC AGG GT GAT GCACAGC AGT CT GC C T C C C CT AT GG GAC 258 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

I I I I I I I I I I I I II I I I 1 I I I I I 1 I I I I! M I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

2641 T AC AC T GAT AT T GAAGAAC CT G GAGAG GAT C CT T CAGT T CT GGC C AT T C C AGGGAC C CT C 2700 

I I I I I I I I 1 I I 1 I I I I I I I I I I I I I 1 I I I I I 1 I I I I I I I I I I II I I I I I I I I I I I I I I I I 
2641 T AC ACT GAT ATT GAAGAAC CT G GAGAG GAT C CT T CAGTT CT GGC CAT T C C AG GGAC C CT C 2700 

2701 C AGAAAC AC AGT GT T T C AAG AG AC C C T AAAAAAC CTGCCTGTCC C AG G AC C C TAT G G T AA 2760 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I i I I I I I II I I 
2701 CAGAAACACAGT GT TT CAAGAGAC C CTAAAAAAC CT GCCT GT C C CAGGAC CCT AT GGTAA 2760 

2761 T GAACAC CAAAC AT CT AAACAAT CAT AT GCT AACAT GCC ACT C CT GGAAAC T C C ACT C T G 2 820 
I II I I I I I I I I I II I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

27 61 T GAACAC CAAAC AT CT AAACAAT CAT AT GCT AACAT GC C ACT C CT G GAAACT C CACT CT G 2 82 0 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II I I I 
2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 88 0 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 

28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I 
2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I II I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I M I I 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 



3121 



3143 



TAAAAATATAAGGCTTAAAAAAA 
I I 1 I I I I I I I I I I I I I I I I I I I I 
3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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ID ADD39868 standard; cDNA; 3143 BP. 
XX 

AC ADD39868; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/ transmembrane protein PR01317. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 



XX 

OS Homo sapiens . 
XX 
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XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI ; 
XX 

DR WPI; 2003-755122/71. 

DR P-PSDB; ADD39869. 
XX 

PT New secreted and transmembrane PRO polypeptides useful for treating 

PT cancers, kidney disorders, Crohn's disease, diabetes mellitus, hyper- or 

PT hypo-insulinemia, sports injuries and arthritis. 

XX 

PS Claim 2; SEQ ID NO 276; 557pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

CC transmembrane protein) having at least 80% amino acid sequence identity 



CC to an amino acid sequence chosen from 123 fully defined sequences as 

CC given in the specification (including their extracellular domains either 

CC or without their associated signal peptides. Also include are the 

CC nucleotide (NA) sequences encoding PRO, a vector comprising the PRO NA, a 

CC host cell comprising the vector, producing PRO, a chimaeric molecule 

CC comprising PRO fused to a heterologous amino acid sequence, and an anti- 

CC PRO antibody. Pro is useful as molecular weight markers for protein 

CC electrophoresis and also for chromosome identification. PRO is also 

CC useful for tissue typing. PRO and PRO NA are useful as hybridisation 

CC probes for a cDNA library to isolate the full-length PRO cDNA. PRO NA is 

CC useful for generating transgenic animals or knock-out animals which are 

CC useful in development and screening useful reagents. PRO NA is also 

CC useful in gene therapy. PR01244, PR01286 and PRO1303 polypeptides are 

CC useful for treating cancerous tumours. PRO1250, PR01418 and PRO1410 

CC polypeptides are useful for suppressing immune response. PR01246 

CC polypeptide is useful for treating cardiac insufficiency disorders. 

CC PR01246 polypeptide is also useful for treating tumours. PR01246 and 

CC PR01561 polypeptide are useful for stimulating calcium flux in human 

CC umbilical vein endothelial cells. PR01265, PRO1250 and PR01474 

CC polypeptides are useful for treating bone and/or cartilage disorders 

CC (e.g., arthritis) and wound healing. PRO1130, PR01275 and PR01418 

CC polypeptides are useful for treating diabetes in skeletal muscle cells 

CC and obesity. PR01265, PR01244 and PR01382 polypeptides are useful for 

CC treating Berger disease or other nephropathies associated with Schonlein- 

CC Henoch purpura, coeliac disease, dermatitis, herpetiformis or Crohn f s 

CC disease. PR01478, PR01265, PR01412, PR01279, PRO1304, PRO1306, PR01418, 

CC PRO1410 and PR01575 are useful in treating thalassaemias . The present 

CC sequence encodes a PRO protein of the invention. 

XX 

SQ Sequence 3143 BP; 656 A; 963 C; 828 G; 696 T; 0 U; 0 Other; 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 



Db 



1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I 1 1 I I M I I I I I I I 1 1 I I I I I I I I I 1 1 I I 1 1 I I 1 1 I M 1 1 I I 1 1 I I I I I i I I I I I I I 

1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 



QY 



Db 



61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I I I I I I I I I I 1 I I I 1 I I I I I I I I I I I I I I I I I I I 1 I I I I ! I I I I I I I I I I II I I I I I I I 
61 AT CC CCAGGCT C CAGAGCT CCCT GGT GACAGT CT GT GGCTGAGCAT GGC C CT CC CAGCCC 120 



Qy 



121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 




Db 



121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 



Qy 



181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 




Db 



181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 



Qy 



Db 



241 CAGGGGAT GAAC GT AGGGC ACT T AGCT T CT T C CAC CAGAAG GGC CT C CAG GATT TT GACA 300 

I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I 

241 C AGG GGAT GAAC GT AGG GC ACT T AGC T T CT T C CAC CAGAAGGGC C T C CAGGAT T TT GAC A 300 



Qy 



301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 



Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T G GAT AT CC AGGAT CCAG GGGT C C C CAGG CTAAAGAAC AT GAT AC CGT GGC C AGCCA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I 1 1 I I I I I I II I I I I I I I I I M I I i I 

Db 361 C CT T G GAT AT CCAGGAT C CAG GGGT C C C C AGGCTAAAGAAC AT GAT AC C GT GGC CAG C C A 420 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT GC C T TT AAGAAGAAGAGCAAT GAGAC AC AGT GTT T CA 4 80 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I II II I I I 

Db 421 GT GAC AGAAAAAAGAGT GAAT GT G C C T TT AAGAAGAAGAGCAAT GAGAC AC AGT GTT T CA 48 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II II I I I 

Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I II I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 601 AGGACAAG GT CAT GGAGGGAAAAG GC CAAAG C C C C TT T GAC C CC GCT C ACAAGC AT AC GG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 C CAT C CT GAT GC GC AC ACT GGGAT CC CAGC CT GT C CT CAAGACC GACAACT T C CT CC GCT 7 80 

I I I I I I I I i I I I I II I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 C CAT C CT GAT GC GC AC ACT GGGAT CC CAGC CT GT C CT CAAGACC GACAACT T C CT CC GCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I! I I I I I I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 T CTTCGAGGAGACAGCCAGCGAGT TT GACTTCTTT GAGAGGCTCCACACAT CGCGGGT GG 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

Qy 901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I 
Db 901 C TAGAGT CT GCAAGAAT GACGT GGGC GGC GAAAAG CT GCT GC AGAAGAAGT GGAC CAC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I M I I I I 

Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 T T GAAC GT GT CT TT AAGGG GAAAT ACAAAGAGT T GAACAAAGAAACT T C AC GC T G GACTA 1200 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T T GAAC GT GT CT TTAAGGG GAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT G GACTA 1200 



Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I 
Db 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 1261 ATAAGG C C CT GAC CT T CAT GAAGGAC CAT TT C C T GAT GGAT GAG CAAGT G GT GGGGAC GC 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I 

Db 1261 ATAAGGCCCT GACCTT CAT GAAGGAC CAT TT CCT GAT GGAT GAGCAAGT GGT GGGGAC GC 132 0 

Qy 1321 CC CT GCT GGT GAAAT C T GGC GT G GAGTAT AC AC GG CT T GCAGT GGAGAC AGC C C AG GGCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 TT GAT GGGCACAGCCAT CTT GTCATGT AC CT GGGAAC CAC CACAGGGTCGCT C CACAAGG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 11 I I I I i I I I I I I I I I I I I I I I I I I I I 
Db 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

Qy 1441 CT GT GGTAAGT GGGGAC AGCAGT GCT CAT CT GGT GGAAGAGAT TCAGCT GTT CCCT GACC 1500 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 41 CT GT GGTAAGT GGGGACAG C AGT G CT CAT CT GGT G GAAGAGAT T CAGCT GT T C C C T GAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I M I I I I I 1 1 I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I 

Db 1501 CTGAACCT GTT CGCAACCTGCAGCT GGCC CCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 15 61 CAGGAG GT GT CT GGAGGGT GC C CCGAGCC AACT GT AGT GT CTAT GAGAG CT GT GT G GACT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

Qy 1681 T GT C T GCC CC CAAC CT GAACT CCT GGAAGCAGGAC AT GGAGCG GGGGAAC C CAGAGT G GG 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 180 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II II I I I I I II I 
Db 1741 CAT GT GC CAGT GGC C C CAT GAGCAGGAGC CTT C GG CCT C AGAGCC GC C C GCAAAT CAT T A 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I 
Db 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAG7\AGCCTCTTCCACTGTCT 1920 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 1981 CAACTGAGAATGGCTTTT CATAC CCT GTGAT CT CCTACT GGGT GGACAGCCAGGACCAGA 2040 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 CAAC T GAGAAT GGCTT TT CATAC C CT GT GAT C T C CT ACT GGGT GGACAGC C AGGAC C AG A 204 0 



Qy 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I i I I I I I ! I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I ! I I I I I 

Db 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I II I I I I I I I I I I I I I I I I I I I I I I I I li I II I I I I I I II I I I I I II I I I I I I I I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAG GC C C C GT TAAGCAGAG AGCAAC AC CT C C AGT C T C C C AAG GAAT GC AGGAC CT CT G 2340 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 AGAAG GC CC C GT TAAGC AGAGAGCAAC AC CT C CAGT CT C CCAAG GAAT GC AG GAC CT CT G 234 0 

Qy 2341 CCAGT GAT GT GGAC GCT GACAACAACT GC CTAGGCACT GAGGTAGCTT AAACT CT AGGCA 24 00 

I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I I I II I I I I II II I I I I I II I I 
Db 2341 CCAGT GAT GTGGACGCT GACAACAACT GCCTAGGCACTGAGGTAGCTT AAACT CT AGGCA 2400 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 2461 T GACT AG GAT GACAGCAGCACAAAAGAC CAC CT T TCTCCCCT GAGAGGAG CT T CT GC T AC 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2461 T GACT AGGAT GACAGCAGCACAAAAGAC CACCTTT CT CC CCT GAGAGGAGCT T CT GCTAC 2520 

Qy 2521 T CT GCAT CACT GAT GACACTC AGC AGGGT GAT GC ACAGC AGTCT GC CT C C C CT AT GG GAC 2580 

I I I I I I I I I II I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2521 T CT G CAT CACT GAT GAC ACT C AGC AGGGT GAT GCACAGC AGT CTGCCTCCC CT AT GGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

Qy 2 641 T ACACT GAT ATT GAAGAACCT GGAGAGGAT C CTT CAGTT CTGGC CATT C CAGGGACC CT C 2700 

I II I I I I I I I I I I I II I I I I II II I I I I I I I II I I II I I I I I I I I I I I I I I I II I I I I I I 
Db 2 641 T ACACT GAT ATT GAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCATTCCAGGGACC CT C 2700 

Qy 2701 C AGAAACACAGT GT TT CAAGAGACC CT AAAAAAC CTGCCTGTCC CAGGAC C C TAT GGT AA 2760 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2701 C AGAAACACAGT GT T T CAAGAGAC C CT AAAAAAC CTGCCTGTCC CAGGAC C CT AT GGT AA 27 60 

Qy 2761 T G AAC AC C AAAC AT C T AAAC AAT CAT AT G C T AAC AT G C CAC T C C T G GAAAC T C CAC T C T G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2761 T GAACAC CAAAC AT CT AAACAAT CAT AT G CT AAC AT G CC ACT C C T G GAAACT C CACT CT G 2820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 88 0 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 



Db 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I II I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 1 ! I I I I I I I I 

Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I i II I I I II I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGA7\AACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 

I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I II I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 8 
ADD70314 
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XX 

AC ADD70314; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PR01317. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 

XX 

OS Homo sapiens. 
XX 

PN US2003054406-A1. 
XX 
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Novel isolated PRO polypeptide useful for tissue typing, modulating 


PT 


biological activity of cell, as molecular weight markers in protein 


PT 


electrophoresis, for treating arthritis, tumor. 
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QY 



1 GGGCT GAGGCACTGAGAGACCGGAAAGC CT GGCATT CCAGAGGGAGGGAAACGCAGCGGC 60 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 T GC C GAC GAC GAC CGCGGGGG GAGGC GGG C AGG G GC C CAT G C C CAGGGT CAGAT AC TAT G 24 0 

I I I I I I I I 1 I I i I i I I I I I I I I I I I I II I I I II I I I I II I I I I I I II I I I I I I I II I I I I 
Db 181 T G CC GAC GAC GACC GC G GG G GGAG G C G GGCAGGGGCC CAT G C C CAGGGT CAGAT ACT AT G 240 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 3 01 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 3 61 CCTT GGATAT CCAGGAT CCAGGGGTCC C CAGGCTAAAGAACAT GATACCGT GGCCAGCCA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 361 CCTT GGATAT CCAGGATC CAGGGGT CCCCAGGCTAAAGAACAT GATACCGT GGC CAGC CA 420 

Qy 421 GT GAC AGAAAAAAG AGT GAAT GT G C C T T T AAGAAGAAGAGC AAT GAGAC AC AGT GT T T CA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 1 I I I I I I I II I I I I I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGACAC AGT GT T T C A 4 80 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I II I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I II I I I I I I I I II I 

Db 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTG7\ACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I I I I I I I I I II I I I I I I I II I I I I I I II I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 601 AGGACAAGGT CAT G GAGG GAAAAGGC CAAAG CC C CTT T GAC CC CGCT CACAAG CAT AC GG 660 

Qy 661 CT GT CTTGGT GGAT GGGAT GCT CTATT CT GGTACTAT GAACAACTTCCT GGGCAGT GAGC 720 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 661 CTGTCTTGGTGGAT GGGAT GCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 C CAT C CT GAT GC GC AC ACT GGGAT C C CAGC CT GT C CT C AAGAC C GAC AACT TCCTCCGCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

Qy 841 T C T T C GAGGAGACAGC CAGC GAGT T T GAC TT CT T T GAGAG G CT C C AC AC AT CGCGGGTGG 900 

I I I I I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



841 T CTT C GAGGAGAC AG C CAG CGAGT T T GACT T CT T T GAGAGG CT C CACAC AT CGCGGGTGG 900 

901 CTAGAGT CTGCAAGAAT GACGTGGGCGGCGAAAAGCT GCT GCAGAAGAAGT GGACCACCT 9 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 C T AGAGT CT G CAAGAAT GACGT GGG C GGC GAAAAGCT GC T GCAGAAGAAGT G GAC C AC CT 9 60 

961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I M II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I i I I 

9 61 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

1141 T T GAACGT GT CT T TAAGGGGAAAT ACAAAGAGT T GAACAAAGAAACTT CAC GCT GGACTA 1200 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I 
1141 T T GAAC GT GT CT T TAAGGG GAAAT ACAAAGAGT T GAAC AAAGAAACT T CAC G CT G GACT A 1200 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

1261 AT AAG G C C C T GAC CTT CAT G AAG GAC CAT T T C CT GAT G GAT GAG C AAG T G G T G G G GAC G C 1320 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 
1261 AT AAGGC C CT GAC C TT CAT GAAG GAC CATT T C CT GAT GGAT GAGCAAGT G GT G GGGAC GC 1320 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I! I I I II I I I I I I I I II I I I 
1321 C CCT G CT GGT GAAAT CT GGCGT G GAGT AT ACAC GG CT T GCAGT GGAGACAG CC CAGGGC C 1380 

1381 T T GAT GGGC ACAGC CAT CTT GT CAT GT ACCT G GGAAC CAC CACAGGGT CGC T C CACAAGG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I II I 
1381 T T GAT GGGC ACAGC CAT CT T GT CAT GT AC C T G GGAAC CAC CACAGGGT C GCT C CACAAGG 1440 

1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1441 CT GT GGT AAGT GGGGACAG CAGT GCT CATC T G GT GGAAGAGATT CAGCT GT TC CC T GAC C 1500 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 C AGGAGGT GT CT GGAGGGT GC CC C GAGC CAACT GT AGT GT CT AT GAGAG CT GT GT GGACT 1620 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 
1561 CAG GAGGT GT CT GGAG GGT GC CC C GAGC CAACT GT AGT GT CT AT GAGAG CT GT GT GGACT 1620 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 T GT CT GC C CC CAAC CT GAACT CCT GGAAGC AG GAC AT GGAGC GG GGGAAC C CAGAGT GGG 1740 



Qy 1741 CAT GT G C CAGT GGC CC C AT GAGCAG GAGC CT T C GG CCT C AGAGC C G C C C G CAAAT CAT T A 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i II I I 1 I I I I I I 

Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

II i I I I I I I I I I I t I I II I I I I I II I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 18 61 T GGCCT CT T ATT AT T G GAGT CAT GG C C CAG C AGC AGT C C CAGAAGC CT CT T C CACT GT CT 192 0 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAACTGAGAAT GGCTTTT CAT ACCCT GT GATCT C CTACT GGGT GGACAGC CAGGACCAGA 2 040 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1981 CAACT GAGAAT GGCTT T T CAT AC C CT GT GAT CT C CTACT GG GT G GAC AGC CAG GAC C AGA 204 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I II I I I I I I II 
Db 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I II I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

Qy 2281 AGAAGGC C CC GT T AAGCAGAGAGCAAC AC CT C CAGT CT C C CAAGGAATGC AG GACCT CT G 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 AGAAGGCC CC GT T AAGCAGAGAGCAAC AC CT C CAGTCT C CCAAGGAAT GCAGGAC C T CT G 2340 

Qy 2341 CCAGT GAT GT GGACGCT GACAACAACT GC CTAGGCACT GAGGTAGCT T AAACT CT AGGCA 2400 

I I I II II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I II I I I I I I I 

Db 2341 C CAGT GAT GT GGAC GCT GACAACAACT GC CTAGGC ACT GAGGT AG CT T AAACT CT AGG CA 2400 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2461 T GACT AGGATGACAGCAGCACAAAAGACCACCTTT CT C CC CT GAGAGGAGCTT CT GCT AC 252 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2461 T GACT AGGAT GAC AGC AGC ACAAAAGAC C ACCTT T CT C C CCT GAGAG GAG CT T CT GCT AC 2520 

Qy 2521 T CT G CAT CACT GAT GACACT CAG CAGGGT GAT G CACAGC AGT CT GCCT C C C CT AT G GGAC 2580 

I II I I I II I I I I I I I I I II I I I I I I I II I I I II I I I I I I I I I I I II I I II I I I I II I I I I 
Db 2521 T C T G CAT CACT GAT GACACT C AGC AG GGT GAT G CACAGC AGT CT G C C T C C C CT AT G GGAC 2580 



Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I I I I I I I I I I I I ! I 1 I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

Qy 2641 TACACT GAT AT T GAAGAAC CT GGAGAGGAT C C T T CAGTT CT GGC C ATT C C AG GGAC C CT C 27 00 

M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I II I I I I I I II I I I I I I II I I I 

Db 2 641 TACACT GAT AT T GAAGAAC CT GGAGAGGAT CCTT CAGTTCT GGCCATT CCAGGGACC CT C 2700 

Qy 2701 C AG AAAC AC AGT G T T T C AAG AG AC C C T AAAAAAC CTGCCTGTCC C AG GAC C C TAT G GT AA 2 760 

I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I 

Db 2701 CAGAAAC AC AGT GT TT CAAGAGAC C CT AAAAAAC CT GC CT GT C C C AGGAC C CT AT GGTAA 2760 

Qy 2761 T GAACAC CAAACAT CTAAACAAT CAT AT GCT AACAT GC CACT C C T GGAAACT CC ACT CT G 2 82 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I 

Db 2761 T GAACAC CAAACAT CTAAACAAT CAT AT GCTAACAT GCCACT CCT GGAAACT CCACT CT G 2 82 0 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 88 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3 060 

I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 T AAAAAT ATAAGGC T T AAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 9 
ADD38435 

ID ADD38435 standard; cDNA; 3143 BP. 
XX 

AC ADD38435; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PR01317. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn f s disease; thalassaemia . 
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XX 
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(GETH ) GENENTECH INC. 

Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 



PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-787000/74. 

DR P-PSDB; ADD38436. 
XX 

PT Novel isolated PRO polypeptide, useful for treating cancerous tumors, 

PT cardiac insufficiency disorders, wound healing, diabetes mellitus, 

PT thalassemias. 
XX 

PS Claim 2; SEQ ID NO 276; 556pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

CC transmembrane protein) having at least 80% amino acid sequence identity 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I I I I I I I II I I I I I I I 1 1 1 1 I I I I I I I I I I i I I I I I I I I I I I I 1 1 I I I I I I I I II I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 AT CC C CAGGCT C CAGAGCT CCCT GGT GACAGT CT GT GGCT GAGCAT GGCCCT CCCAGCC C 120 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGGGGAT GAAC GT AGGGCACTTAGCTT CTTCCACCAGAAGGGCCT C CAGGATTTT GACA 300 

I II I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 241 CAGGGGAT GAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 3 60 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I II I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CTTGGATAT CCAGGAT CCAGGGGT CCC CAGGCTAAAGAACATGATACCGT GGCCAGCCA 420 

I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 361 C CT T GGAT AT C C AG GAT C C AG GG GT C CC C AGG C TAAAGAACAT GAT AC C GT GGCCAGC CA 420 

Qy 421 GT GAC AGAAAAAAG AGT GAAT GT G C C T T T AAG AAGAAG AG C AAT GAGAC AC AGT GT T T C A 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 421 GT GAC AGAAAAAAG AGT GAAT GT GC CTT T AAGAAGAAGAG CAAT GAGACAC AGT GT TT CA 480 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I II I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 



Qy 



541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



541 



601 



601 



661 



661 



721 



I I I t I I I I I II I I I f II I I I I I I I I I I I I I I II I I i I I I I I I I I I I I I I I I I I I I I I I I I 
CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

AG GAC AAGGT CAT GG AG GGAAAAG GC CAAAGC C C CT T T GAC C C C GCT CACAAGC AT AC GG 660 

II I I I I I I I I I II I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I M I I I I I I I I I I I I I I || I I I || I | I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 

CT GT CTT GGT GGAT GGGAT GCT CT ATT CT GGT ACTATGAACAACTT C CT GGGCAGTGAGC 720 



780 



C CAT C CT GAT GC G CAC ACT GG GAT C C CAGC CT GT C CT CAAGAC C GACAAC TTCCTCCGCT 

M I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 



781 



781 



841 



GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 
I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 



T CT T C GAGGAGAC AGC C AG C GAGT T T GACT T C TTT GAGAG GCT C CACAC AT CGCGGGTGG 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 



901 



901 



961 



CT AGAGT CT GCAAGAAT GAC GT GG GC GGC GAAAAGCT G CT GC AGAAGAAGT G GAC CAC CT 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT AGAGT CT GCAAGAAT GAC GT G GGC GGC GAAAAGCT GCT GCAGAAGAAGT GGACCACCT 



840 



840 



900 



900 



960 



960 



TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 
I I I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I II I I I I I II I II I I I 
961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I 
1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

1141 T T GAACGT GT CTT TAAGGG GAAAT ACAAAGAGTT GAACAAAGAAACT T CAC GCTGGACT A 1200 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1141 T T GAAC GT GT CTT TAAGG GGAAAT ACAAAGAGTT GAACAAAGAAACT T CAC GCT G GACT A 1200 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 ATAAGGC CCTGAC CT T CAT GAAGGACCATTTCCT GATGGAT GAGCAAGT GGT GGGGACGC 132 0 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 138 0 

1381 T T GAT GGGCACAG CC AT CTT GT CAT GT AC C T G GGAACC AC CAC AGGGT C GCT C CACAAG G 1440 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 13 81 T T GAT GGG C AC AGC C AT C T T GT C AT GT AC CT GGGAAC C AC CAC AG GGT C GCT C C ACAAGG 14 40 

Qy 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I I I I I I I I I I I I I i I I I I I I I I I I I I I I I i I I I I I I I I I I I II II I I I I I I I II I I I I I I 

Db 1441 CT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCT GT T C CCT GAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I | I I I I | | | | 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 C AGGAGGT GT CT GGAGGGT GC C C CGAGC CAACTGTAGT GT CTAT GAGAGCT GT GT GGACT 1620 

I I I I I I I I I I I I I I I I I I i I I I I II I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I 1 I 

Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I II I I I I I I I II I I I I I I I I I I I I I II I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

1 1 1 1 1 1 1 I I I I I 1 1 1 I I I I I I I I I I 1 1 1 I I I I 1 1 I 1 1 1 I I 1 1 1 1 1 I I I I I I I I I i 1 1 1 1 I 

Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 

Db 1741 CAT GT GCCAGT GGC CCCAT GAGCAGGAGC CTT CGGCCT CAGAGCC GC C C GCAAAT CATTA 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I I I I I I I I I II II I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 T GGC CT CT TAT T ATT GGAGT CAT GGC CC AGCAGCAGT C C CAGAAG CCT CT T C CACT GT CT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAACT GAGAAT GGCT T T T CAT AC C CT GT GAT C T C CT ACT G GGT GGAC AGC C AGGAC C AGA 2040 

I M I I II II I I II I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1981 CAACT GAGAAT G GCT TT T CAT AC C CT GT GAT CT C CT ACT GG GT GGAC AGC CAGGAC C AGA 2040 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I II I I II I II I I I I I 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 



Qy 2281 AGAAGGCCCCGTTA?lGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 234 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2281 AGAAGGC C C C GT TAAGC AGAGAG CAACAC C T C CAGT C T C C CAAGGAAT GC AG GAC CT CT G 2340 

Qy 2341 C CAGT GAT GT GGACGCT GACAACAACT GCCT AGGCACTGAGGTAGCTTAAACT CTAGGCA 2400 

I M I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 24 00 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I II I I I I I I I I I I I I II I I I I I I I I I I II I II I I I I I II I I I I I I II II I I I I I II I I I I 
Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 24 61 T GACT AG GAT GACAG CAG CACAAAAGAC CACC T T T CT CC C CT GAGAGGAG CTT CT GCT AC 2520 

I I i I I I I I I I I I I I II I I I I I I I I I I I II I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 61 T GACTAGGAT GACAGCAGCACAAAAGACCACCTTTCT CCCCT GAGAGGAGCTT CT GCTAC 252 0 

Qy 2521 T CT GCAT CACTGAT GAC ACT CAG CAG GGT GAT GCACAGCAGT CT GCCT C C CCT AT GGGAC 258 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GC CT CCC CTAT GGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2 641 T ACACTGATATT GAAGAACCT GGAGAGGAT CCTTCAGTT CT GGCCATTCCAGGGACCCT C 2700 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2641 T ACACT GAT ATT GAAGAACCT GGAGAGGAT CCT T CAGTT CT GGC CATT CCAGGGAC C CT C 2700 

Qy 2701 C AGAAAC ACAGT GT T T CAAGAGACC CT AAAAAAC CT GC CT GT CC CAG GAC C CT AT GGTAA 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 27 01 C AGAAAC ACAGT GT T T CAAGAGAC C CTAAAAAAC CT G C CT GT C C C AGGAC C CT AT GGTAA 2760 

Qy 2761 T GAACACCAAACAT CTAAACAAT CAT AT GCTAACAT GCCACT CCT GGAAACT C CACT CT G 2820 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I 

Db 2761 T GAAC AC CAAACAT CTAAACAAT CAT AT GCT AACAT GC CACT CCT GGAAACT C CACT CT G 2820 

Qy 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 88 0 

Qy 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGT^AGTCTTTCCTGAAGTCTGA 2940 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

Qy 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 



Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I i I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

RESULT 10 
ADD39391 

ID ADD39391 standard; cDNA; 3143 BP. 
XX 

AC ADD39391; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PR01317. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease 

KW dermatitis; herpetiformis; Crohn* s disease; thalassaemia . 

XX 

OS Homo sapiens. 
XX 

PN US2003096954-A1. 
XX 
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XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-786999/74. 

DR P-PSDB; ADD39392. 
XX 

PT Novel isolated PRO polypeptide useful for tissue typing, modulating 

PT biological activity of cell, as molecular weight markers in protein 

PT electrophoresis, for treating arthritis, tumor. 
XX 

PS Claim 2; SEQ ID NO 276; 550pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I ! I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I ! I I I I I I I I I 
Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I 1 I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M 1 I II I I I I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | I I I I I I I I I I I I I I 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 



Qy 241 C AGGG GAT GAAC GT AG G GC ACT T AGCT T CT T CCAC CAGAAG G GC CT C CAGGAT T T T GAC A 300 

II I M II I I I I I II I I I II I I I I I | || | | | | | | | | | | | | | | | | | | | | | | || | | 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I II I I I M I I I I I II II I I I I I II I II I I I I I II I I II I I I I I I 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CTT GGAT AT C CAGGAT CCAGGGGT CCCCAGGCTAAAGAACAT GATAC CGT GGCCAGCCA 420 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | I II I I I I I I I I I I 

Db 361 CCTT G GAT AT C CAGGAT C CAGGGGT CC C CAGGCT AAAGAACAT GATAC C GT GGC C AGC C A 42 0 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAAT GAGACACAGT GTTTCA 480 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I | I I I 
Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 48 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I M I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

M I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | || | | | | | | M I I I I I I I I I I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AG GAC AAG GT CAT G GAGGGAAAAG GC C AAAGC C C CT T T GACC C C G C T CACAAGCATAC G G 660 

I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | | | | 

Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

Qy 721 C CAT C CT GAT GC G CAC ACT GGGAT C C C AGC CT GT C CT C AAGAC C GAC AACT T CCT C C GC T 78 0 

I I I I I I I I I I I I I I I I M I I I M I I II I I I I I I I I II I I I I I I II I I I I I I II I I I I I | I 
Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 T CT T C GAGGAGAC AGC C AG C GAGT T T GACTT CT T T GAGAG GC T C CAC AC AT CGCGGGTGG 90 0 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I 
Db 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

Qy 901 CTAGAGT CT GCAAGAAT GAC GT GGGC GGC GAAAAGCT G C T GC AGAAGAAGT GGAC CAC CT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I 

Db 901 C T AGAGT CT GCAAGAAT GAC GTGGGCGGC GAAAAG CT GCT GCAGAAGAAGT GGAC CACC T 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I M I I I I I I I I I I I I I I || I I I I I I I I I I I I I I | | || | | | | | | | | | | | | | | | | | | | | | M 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i I 

Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 TT GAAC GT GT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CAC GCT GGACT A 12 00 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I i I I I M I I I I I I I I I I II I I I I I I I I I I I I 

Db 1141 T T GAAC GT GT CTT T AAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC G CT GGAC T A 1200 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

I I I I I II I I I II I I I M I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 

Db 12 61 AT AAGGC C CT GAC CT T CAT GAAG GAC CAT T T C CT GAT GGAT GAGCAAGT GGT G GGGACG C 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 13 80 

Qy 1381 T T GAT GG G CAC AG C CAT CT T GT CAT GT AC C T GG GAAC CAC C ACAGGGT C GCT C CACAAGG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I 
Db 1381 T T GAT G GG C AC AGC C AT CT T GT CAT GT AC CT GGGAAC CAC C AC AGGGT C GCT C CACAAG G 1440 

Qy 1441 CT GT GGTAAGT GGGGAC AGCAGT GCT CAT CT G GT GGAAGAGATT CAGCT GTT C C CT GAC C 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 C T GT GGT AAGT GGGGACAG C AGT GCT CAT CT GGT GGAAGAGAT T CAG CT GT T C C CTGAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I II I I I II I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGT GT CT GGAGGGT GCCCCGAGC CAACT GTAGT GT CTAT GAGAGCT GT GT GGACT 1620 

I 1 1 I II I I I I I 1 1 1 I I I I I I I I I I I I I I I 1 1 I I I I 1 1 1 I I II I I I 1 1 I I 1 1 I I I I 1 1 I i I 

Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGT GGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 T GTCTGC CCCCAACCTGAACTCCT GGAAGCAGGACATGGAGCGGGGGAACC CAGAGT GGG 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 T GT CT GC CC CC AAC CT GAACT C CT G GAAGC AG GACAT GGAGC GGG G GAAC C CAGAGT GGG 174 0 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1741 CAT GT GCCAGT GGCCCCAT GAGCAGGAGCCTT CGGCCT CAGAGCCGCCC GCAAAT CATT A 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I 

Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I 



Db 


1921 


ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 


1980 


Qy 


1981 


CAAC T GAGAAT G GCT T T T CAT AC C CT GT GAT CT C CT ACT GGGT GGACAGC CAGGAC CAGA 


2040 


Db 


1981 


1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 II t 1 1 I 1 1 1 1 I 1 II I I I I 
CAAC T GAGAAT GG C T T T T C AT AC CCT GT GAT CT CCTACT GGGT GGACAGC CAGGAC CAGA 


2040 


Qy 


2041 


CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 


2100 






1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I I I I I I I I | | I | | | | | 




Db 


2041 


CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 


Qy 


2101 


CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 


2160 






1 1 t 1 1 1 I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 I ! 1 
1 1 1 1 i 1 1 1 1 M 1 1 M M 1 I 1 M 1 1 1 1 II 1 1 1 1 1 1 I 1 II 1 1 1 II 1 1 1 1 | | | | | I I II 1 M 1 




Db 


2101 


UUAGGG1 LAG I GG1 GGGGCOGCCC1 GGCrGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 


2160 


Qy 


2161 


CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 


2220 






1 1 1 1 1 1 1 i 1 1 1 1 1 1 ! t 1 { 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 t 1 1 1 1 1 1 1 l t 1 1 < 1 1 1 1 i t i i i 

1 II 1 II 1 i 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


2161 


Ci Gl LALI Gl CC1 CI I IbCLi I AGrGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 


2220 


Qy 


2221 


CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 


2280 






i i i i t i i t i t i i i i i i i i i i > i i i i > i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i 
1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 i 1 1 11 II 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


2221 


CA1 1 GAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 


2280 


Qy 


2281 


AGAAGGC C CC GT TAAGC AGAGAG CAACAC CT C C AGT CT C C CAAG GAAT GC AG GAC CT CT G 


2340 






i i i i i i i i i i i i i i i i i i i t t i t i i i i i i t t i i i i i t i i i i i i i i i i i t i i i i i i i i i i i 
1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 M 1 1 




Db 


2281 


AGAAGGC C CC GT TAAGC AG AG AG CAACAC CT CCAGTCT C CCAAGGAAT GCAGGAC CT CT G 


2340 


Qy 


2341 


C C AGT GAT GT GGAC GCT GACAACAACT GCCT AGGCACT GAG GT AGCT TAAACT CT AGGCA 


2400 






1 1 1 1 1 1 1 ! 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 i f I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 j 1 ! 1 1 1 I 1 1 1 

1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2341 


GLAG1 GA1 GI GGACGCrGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 


2400 


Qy 


2401 


CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 


2460 






l l I l i l i i i i i i i i i i i i i t i i i i i i i t i i i i i t i i i t i i i i i i i i i i i i i i i i i i i i i i 
1 1 1 1 I 1 1 M II 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 II I I I I I I I I I 




Db 


2401 


UA^icrUHjCjULrUl LrULrLrl btAbbLALL i bbLuAI GC 1 GGC 1 GGGCGGCCCAAGCACAGCCC 


2460 


Qy 


2461 


T GACTAGGAT GACAGCAGCACAAAAGACCAC CTTT CT CCCCT GAGAGGAGCTTCT GCT AC 


2520 






i i i i i t i i i i i i i i i i i i i > i i i i i i i i i i i i i i > i i i t t i i i t i t i i i i i i i t i i i i i i 
1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 11 1 1 1 I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2461 


1 bAblAbbAl bAbAbbAbbALAAAAbALLALb i 1 1 CCCC X GAGAGGAGCTTCT GCTAC 


2520 


Qy 


2521 


T CT GCAT C ACT GAT GACACT CAGCAGGGT GAT GC ACAGCAGT CT G CCT C C C CT AT G GGAC 


2580 






1 1 1 1 1 1 i I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1| 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


2521 


T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GCCT C CCCTAT GGGAC 


2580 


Qy 


2581 


TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 


2640 






M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2581 


TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 


2640 


Qy 


2641 


T AC ACT GAT AT T GAAGAAC CT GGAGAG GATC CT T C AGTT CT GGC C AT T C CAGGGAC CCT C 


2700 






1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 




Db 


2641 


T AC ACT GAT ATT GAAGAAC CT GGAGAGGAT C C T T CAGTT CT GGCCAT T C CAGG GAC C CT C 


2700 


Qy 


2701 


C AGAAAC AC AGT GT TT CAAGAGAC C CTAAAAAAC CT GCC T GT C C CAG GAC C CT AT GGTAA 


2760 






M 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2701 


CAGAAAC AC AGT GT TT CAAGAGAC C CTAAAAAAC CTGCCTGTCC CAGGAC C CT AT GGTAA 2760 


Qy 


2761 


T GAACACCAAACAT CT AAACAAT CAT AT GCT AACAT GCCACT CCT GGAAACT C CACT CT G 


2820 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 II 1 




Db 


2761 


T GAAC AC CAAAC AT CTAAACAAT CAT AT GCT AACAT GC C ACT C CT GGAAAC T C CACT CT G 


2820 



Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 880 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I I I I I I 1 I I I I ! I I I I I II I I I I I I I I I I I I I M I I I I I I I ! I I I I I I I I I I I I I I I I I 
Db 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I | I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I II I I I I I I II I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAAT ATAAGGCT TAAAAAAA 3143 

I I I II I I I I I I I I I I I II I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

RESULT 11 
ADD38914 



ID ADD38914 standard; cDNA; 3143 BP. 
XX 

AC ADD38914; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PR01317. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 

XX 

OS Homo sapiens . 
XX 

PN US2003092061-A1. 
XX 

PD 15-MAY-2003. 
XX 

PF 06-DEC-2001; 2001US-00007194 . 
XX 

PR 01-SEP-1998; 98US-0098716P . 

PR 01-SEP-1998; 98US-0098723P . 

PR 01-SEP-1998; 98US-009874 9P . 

PR 01-SEP-1998; 98US-0098750P . 

PR 02-SEP-1998; 98US-0098803P . 

PR 02-SEP-1998; 98US-0098821P . 



PR 


02 


-SEP- 


-1998 


98US- 


-0098843P. 


PR 


09 


~SEP- 


-1998 


; 98US- 


-0099536P. 


PR 


09- 


-SEP- 


-1998 


98US- 


-0099596P. 


PR 


09- 


-SEP- 


-1998 


98US- 


-0099598P. 


PR 


09- 


-SEP- 


-1998 


98US- 


-0099602P. 


PR 


09- 


-SEP- 


-1998 


98US- 


-0099642P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099741P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099754P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099763P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099792P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099808P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099812P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099815P. 


PR 


10- 


-SEP- 


-1998 


98US- 


-0099816P. 


PR 


15- 


-SEP- 


-1998 


98US- 


-0100385P. 


PR 


15- 


-SEP- 


-1998 


98US- 


-0100388P. 


PR 


15- 


-SEP- 


-1998 


? 98US- 


-0100390P. 


PR 


16- 


-SEP- 


-1998 


; 98US- 


-0100584P. 


PR 


16- 


-SEP- 


-1998, 


? 98US- 


-0100627P. 


PR 


16- 


-SEP- 


-1998, 


? 98US- 


-0100661P. 


PR 


16- 


-SEP- 


-1998, 
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New isolated PRO polypeptide such as PRO1560, PR0444, PRO1018, PR01773, 
PR01244, PR01246, useful for treating cancerous tumors, cardiac 
insufficiency disorders, wound healing, Crohn's disease, celiac disease. 

Claim 2; SEQ ID NO 276; 555pp; English. 

The invention relates to an isolated PRO polypeptide (secreted or 
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CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M 

CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 162 0 
GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 
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I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 

GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 
TGTCTGCCCC CAAC CT GAACT C CT GGAAGC AG GAC AT G GAGC GGGG GAAC C CAGAGT G G G 174 0 

MINIMI II I I I I I II I I || I | | | | || | || || | | | | | | | | | | | M i | 

TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 18 00 

M M II I I I I I I I I I || | | | | | | | | || I I I I II I I I I I || I I I I || 

CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

M I I I II I II I I M II I I I I I I II I I I I I I I I I I I I I I I I I I I I I || | | | || || | | | | | | 

AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 
I M II II I I I I I I I I I || || || I I I | I | | | || | | | | | M | || | | | | | | || | | | || | | | | | 
T G GC CT CT T ATT AT T GGAGT CAT GGC C C AGCAGCAGT C C CAGAAGC C T CT T C CACT GT CT 1920 

ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

M II I II II I I I I I II I II I I II I I II I I I II II I I I I I I I I I | | | | | | | | | || | | || || 

ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 
CAACTGAGAATGGCTTTT CATACCCT GT GATCT CCTACT GGGT GGACAGCCAGGACCAGA 204 0 

I M II II I I I I I I I I I I I I I I I II || I | | | | | | | | | | | | | | | | | | | || | || | | | | | | | || 

CAACT GAGAATGGC TT TT CAT ACC CT GT GAT CT C CTACT GG GT GGAC AGC CAGGAC C AGA 2 04 0 
CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

M I II M II M II I II I I I II I II I I I I I I I 1 1 I I I I II II II I I II II I I I Ml 

CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 
M II II I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | || | || | | | | | | | || || | | || | | 
CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 
M I II II II II II II I I II I I I II II I I I II I I I I I II I II I || I I I || || | | || | || || 
CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I M I I I II I I I I I I I I I I I I I I II | I | || | || | | | | | | | | | | | | | | | | | | || || 

CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 234 0 
i I I I I M I I I I I I I I I I I I I I I I I || | | | | || | | | || | | | | | | | | | | || | | | | | | | | | || 
AGAAGGC C CC GT TAAG C AGAGAGCAACAC CT C C AGT CT C C CAAGGAAT G CAGGAC CT CT G 234 0 

CCAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT GAGGT AGCTTAAACT CTAGGCA 2400 
I M II II I II I I I II I I I I II I I I || | | | | | | | | | | || || || || || || | | || | || || | || 
CCAGT GAT GT GGAC GCT GACAACAACT GC CTAGGCACT G AGGT AGCTTAAACT CTAGGCA 24 00 

CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

M I II II I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | || || | | || || | | 

CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 
T GAC TAG GAT GAC AGCAGC ACAAAAGAC C AC CTTTCTCCCCT GAGAGGAG CTT C T GC T AC 252 0 

M II I II I I II I I II I I I I I I I I I I I I I I II I II I I II I II I II II I II II II II I II II 



Db 



24 61 T GAC T AGGAT GAC AGCAG CAC AAAAGAC C AC CTTTCTCCCCT GAGAGGAGCT T C T GC T AC 2520 



QY 2521 T CT G CAT C ACT GAT GAC AC T C AG CAGGGT GAT G CAC AG CAGT CT G CCT C CC CT AT GG GAC 258 0 

I I I I I M I I I I I M I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 T CT G CAT CAC T GAT GAC AC T C AGCAGGGT GAT G CAC AG CAGT CT GC CT C C CCT AT GG GAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

Qy 2641 T ACACT GAT ATT GAAGAAC CT GGAGAGGAT C CTT CAGT T CT GGC CAT TC CAGGGAC C C T C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 

Db 2641 T AC ACT GAT AT T GAAGAAC CT GGAGAGGAT C C TT C AGT T CT GGC CAT T C CAGGGAC C CT C 27 00 

Qy 27 01 CAGAAACACAGT GTTT CAAGAGACCCT AAAAAAC CT GC CT GTC C CAGGAC CCT AT GGTAA 27 60 

I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I II I I I I I I M I I I 
Db 27 01 CAGAAACACAGT GTTT CAAGAGACCCT AAAAAACCT GC CT GTC CCAGGACC CTAT GGTAA 2760 

Qy 2761 T GAACAC CAAACAT CT AAACAAT CAT AT G CT AACAT GC CACT C CT GGAAACT CCACT CT G 2820 

I M I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 T GAACAC CAAACAT CT AAACAAT CAT AT GCTAACAT G C CAC T C CT GGAAAC T C C ACT CT G 282 0 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 880 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
Db 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 314 3 

I I I I I I I I I I I I II II I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 12 
ADD40345 

ID ADD40345 standard; cDNA; 3143 BP. 
XX 

AC ADD4 034 5; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PR01317. 
XX 



KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn 1 s disease; thalassaemia . 

XX 

OS Homo sapiens. 
XX 

PN US2003082627-A1. 
XX 

PD 01-MAY-2003. 
XX 

PF 06-DEC-2001; 2001US-00006117 . 
XX 

PR 01-SEP-1998; 98US-0098716P . 
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PR 01-SEP-1998; 98US-0098750P . 
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PR 29-JUN-2001; 2001WO-US021066 . 

PR 09-JUL-2001; 2001WO-US021735 . 

PR 04-SEP-2001; 2001US-00946374 . 
XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-755104/71. 

DR P-PSDB; ADD40346. 
XX 

PT New isolated PRO polypeptides such as PRO1560, PR0444, PRO1018, PR01773, 

PT PR01244, PR01246, are useful for treating cancerous tumors and cardiac 

PT insufficiency disorders. 
XX 

PS Claim 2/ SEQ ID NO 276; 550pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

QY 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I I I I I I I I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

QY 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

QY 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I M I I t I I I I I I II I I II I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

M M I M II I I I I I i I I I II I I I I I I I | | | | | | | | | | ) | | | | | | | | | | | | | || | || | | | | 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

Qy 241 C AGGGGAT GAAC GT AG GGCACT T AG CT T CT T C C AC C AGAAG GGC CT C CAGGAT T T T GAC A 300 

I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 C AG G GGAT GAACGT AG GGCACT TAGCTT CT T C CAC CAGAAGGG C CT C CAG GAT TT T GAC A 300 

Qy 3 °1 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I ■ I ■ I I ■■ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIUM 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTTGGATAT C CAGGAT C CAGGGGT CCC CAGGCTAAAGAACAT GAT AC CGT GGCCAGCCA 42 0 

I I I I I I I I I I M I M I I I I I I I M I I I I I I I II I I I I I I I I I I I II I I I I I I I II I I I I I 

Db 3 61 C CT T GGAT AT C CAGGAT C CAGGGGT CCC CAGGCTAAAGAACAT GAT AC C GT GGCC AGC C A 420 



Qy 

Db 



421 GT GAC AGAAAAAAGAGT GAAT GT GC CTT TAAGAAGAAGAG CAAT GAGAC ACAGT GT TT C A 4 80 

I I I I M I I I II II II II I I I II I I M I II M I I I I I M II II M I I I II II I 

421 GT GACAGAAAAAAGAGT GAAT GT GC CTT TAAGAAGAAGAG CAAT GAGAC ACAGT GTTT C A 480 



Qy 


481 


r\K^± x wlx ^wJ. <Jx l?Vjx x x v_,x ljt\\^J\t\± bl w-vb^^Al LlALAUUl CCGCCACCI ICG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 


54 0 


Db 


481 


540 


Qv 


541 


j. x w^aj<^^\^ X o^-. i x ijl/i^^l 1 w-Vx x K3fAJ-\k^ x 1 ^i\J-\sjJ\x 1 1 G 1 1 GCCCA1 CTCGG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 


s~ r\ r\ 


Db 


541 


s~ r\ r\ 

600 


Ov 
Db 


601 
601 


f\o^s\^f\t\\jK3 x ^^f\\zr^KzjjAt\t\^K3^K^K^ ill GACCCCGC 1 C AC AAG CAT AC G G 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 


r s~ a 

660 
660 


Ov 


661 


^x <j± ^ i x bbl bbAl yjyjKjJAl <aC 1 CI Al 1 C 1 bblALlAl CAACAACl x CCI GGGCAGTGAGC 

1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 


720 


Db 


661 


720 


Ov 


721 


CPAT'CPTnATf^Pf^r* JycTxcvccrz&TCCCT^ ccCTCTcr*Tr*7s. flrArrr , 7\PAAr | TTTippmrippr'rn 
v^w^x <-,k^± uLu ^/\^./\L> 1 <a<alj/\x LLUAbLL ibi CCi CAAGACCGACAAC 1 1 CCTCCGCT 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 


780 


Db 


721 


780 


Ov 


781 


ubUJ.^AJ.^Alb/iLbLblbUl 1 1 CI bbLAbLLAl CCC 1 1 CGACCCAGGTCGTCTACTTCT 

1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 I I 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 

GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 


840 


Db 




840 


Ov 


841 


x ^ x x okj^-v\jiji-v^/\^/\kj^UACCCACl 1 1 CAC 1 1 C 1 1 1 GAGAGGC 1 CCACACAJ. CGCGGGTGG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 ii 1 1 ii 1 1 1 1 1 1 1 1 1 n 1 1 1 1 ii 1 1 1 1 1 ii 

TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 


900 


Db 


841 


C\ c\ r\ 


Ov 


901 

~J \J X 


o i iti ijL,i-\/\bx/\Ax LjACC 1 CCCCGGCGAAAAGC 1 GC x GCAGAAGAAGTGGACCACCT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTAGAGTCT GCAAGAAT GACGT GGGCGGC GAAAAGCTGCTGCAGAAGAAGT GGACCACCT 


960 


Db 


qni 

J yj x 


960 


Ov 


Jul 


T C CT CJ\ 7\ CCC C C a CCTCCTC^rr* 7\ ffPA r*c i r t r*CT , r t C7\ r* r^T* r* r* r* r*rr\cn r* t\ 7\ pr<mp7impririnn 
x bH/ibbLU^AbLl b^l bLAULLAbLLbbbbbAbtl bCCCTTCAACGTCATCCGCC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 

TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 


1020 


Db 


961 


1020 


Ov 


1021 


AC GPGGT CCTCCT CC CCCCC C T\TTCT C C C a C a C c TCCCC a c a Tc^n r , r , 7\r , mr'mmr'« A/~»r«m 
n^u^ou x <^v,x <j^x v^^v^^o^^Lx/-ix lti k/Ll/iU/iijLl bbbLAbAI CI ACCCAGx C 1 X CACC X 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 


lUou 


Db 


1021 


1080 


Ov 
Db 


1081 
1081 


CCC T\CTCCC A CCTT CCC CCCJXCC a CC a CCTCTCr , r*CTTTr t ^r , r , r i HiHinninwr*rnr*rnmr t r i apa 
V-'^V^rvjri. OO^nuoj. X icr *or^ icr K^JAKj 1^1 bbbb illbi CCC 1 iCxClCxCx 1GGACA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 


1140 

1 1 A C\ 

114 0 


Ov 
Db 


1141 
1141 


TTGAAPGTGTPTTT A ACCCCJX a AT 7\C a a ACHCTTCL. ar*aaar*aaA nrpp 7\ nr*nrnr*r*T, r*m 7\ 
x x \3f\r\\^\zr x x x J-\t\*j \j Kj icr/l/l/A. l J^K^JAJAJAkjJ^^j l I bAAbAAAbAAAL 1 1 CACGC x GGAC x A 

1 1 M 1 1 1 1 1 1 1 1 I 1 M 1 1 1 1 1 1 1 1 1 I I I I I I I I | | M I | | | | | | | | | | M | | | | | | | | | | 

T T GAAG GT GT CT TTAAGG GGAAAT ACAAAGAGT T GAACAAAGAAACT T C AC GCT GGACT A 


i o r\ c\ 
1Z (JO 

1200 


Qy 


1201 


CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 
1 1 1 1 M 1 1 1 1 1 1 1 I I M I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 


1260 


Db 


1201 


1260 


Qy 

Db 


1261 
1261 


ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 M | | | | | | I I I | 
ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 


1320 
1320 



Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 13 80 

I I I I I I I I I I I I I M I I I I I I I I I i I I I I I I I I I I 1 1 I I I I I I I I I I | | | | | | | | | | | | | 

Db 1321 C C CT GC T GGT GAAAT CT GGC GT GGAGT AT ACAC GG CT T GCAGTG GAGAC AGC C CAGG G C C 1380 

Qy 1381 T T GAT G G GC AC AG C CAT C T T GT C AT GT AC C T G G GAAC CAC C AC AGGGT C GCT C C ACAAGG 1440 

M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | 
Db 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 144 0 

Qy 1441 CT GT GGTAAGT GGGGACAGC AGT GCT CAT CT GGT G GAAGAGAT T C AGCT GT T CC CT GAC C 1500 

I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CT GT G GT AAGT G G G GAC AGC AGT GCT CAT CT GGT G GAAGAGAT T C AGCT GT T C C CT GAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

M I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | I | I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 162 0 

I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I | | I | | 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCC CAAC CT GAACT CCT GGAAGC AG GAC AT GGAG C GGG G GAAC C C AGAGT GG G 174 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 18 00 

I I I I M I I I I I I I I I I I I I I II I I I I I I I I I | i | | M I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I M I I I I I I I I I I I I II I i I II I I I I I II I II I I I I I I I I I I I I I I II I I I I I I I I 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 192 0 

I M I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 192 0 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I | | | M I | | | 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 1981 CAACT GAGAAT GGCTTTT CAT AC CCT GT GAT CT CCTACT GGGT GGACAGCCAGGACCAGA 2040 

I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I 
Db 1981 CAACT GAGAAT GGCTTTT CAT AC C CT GT GAT CT C CTACT G GGT GGAC AG C CAG GAC C AGA 2 04 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I M I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 



1 1 1 i 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 8 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I M I I I I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAGGCC CCGTTAAGCAGAGAGCAACACCTCCAGTCTC CCAAGGAAT GCAGGACCT CT G 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I 
Db 2281 AGAAGGC C C C GT T AAGCAGAGAG CAACACCT C C AGT CT C CCAAG GAAT GCAGGAC CT CT G 2340 

Qy 2 341 C CAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT GAGGT AGCTT AAACT CTAGGCA 2400 

I M I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT GAGGT AGCTTAAACT CTAGGCA 24 00 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2 461 T GACTAGGAT GACAGCAGCACAAAAGACCACCTTT CT CCCCTGAGAGGAGCTT CT GCTAC 2 52 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 T GACTAGGAT GACAGCAGCACAAAAGAC CACCTTT CT CCCCT GAGAGGAGCTT CT GCTAC 2520 

Qy 2521 T CT GC AT C ACT GAT GAC ACT CAGC AGGGT GAT GCACAGC AGT CT GC CT C CC CT AT GGGAC 2580 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 TCT GCAT CACTGAT GACACT CAGC AGGGT GAT GCACAGCAGT CT GCCT CCCCT AT GGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2641 TACACTGATATT GAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCATT CCAGGGACCCT C 2700 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 641 T ACACT GATATT GAAGAACCT GGAGAGGAT CCTTCAGT TCT GGCCATT CCAGGGAC CCT C 2700 

Qy 2701 CAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGTCCCAGGACCCTATGGTAA 2760 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2701 C AGAAACACAGT GT T T CAAGAGAC C C T AAAAAAC CTGCCTGTCC CAGGAC C CT AT G GTAA 27 60 

Qy 2761 T GAAC AC CAAACAT CTAAACAAT CAT AT GCTAACAT G CCACT C CT GGAAACT C CACT CT G 2820 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 T GAAC AC CAAACAT C T AAACAAT CAT AT GCTAACAT GCCACT CCT G GAAACT C CACT CT G 2 82 0 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I I I I I I I I I I I I I I I II I I II I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

Qy 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II II I I I I M I I I I I I I I I I I I I I I I I I I I II 

Db 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 



Db 



3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 



Qy 



3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 




Db 



3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 



Qy 




Db 



RESULT 13 




ADE50566 




ID 


ADE50566 standard; cDNA; 3143 BP. 


XX 






AC 


ADE50566; 




XX 






DT 


29-JAN-2004 


(first entry) 


XX 






DE 


Human cDNA encoding secreted/transmembrane protein PR01317. 


XX 






KW 


Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 


KW 


immune response; cardiac insufficiency disorder; calcium flux; 


KW 


umbilical vein endothelial cell; bone disorder; cartilage disorder; 


KW 


arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 


KW 


Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 


KW 


dermatitis ; 


herpetiformis; Crohn's disease; thalassaemia . 


XX 






OS 


Homo sapiens. 


XX 






PN 


US2003069179-A1. 


XX 






PD 


10-APR-2003 




XX 






PF 


ll-DEC-2001; 2001US-00015393 . 


XX 






PR 


01-SEP-1998 


; 98US-0098716P. 


PR 


01-SEP-1998 


98US-0098723P. 


PR 


01-SEP-1998 


? 98US-0098749P. 


PR 


01-SEP-1998, 


? 98US-0098750P. 


PR 


02-SEP-1998 


; 98US-0098803P. 


PR 


02-SEP-1998 


; 98US-0098821P. 


PR 


02-SEP-1998 


98US-0098843P. 


PR 


09-SEP-1998 


; 98US-0099536P. 


PR 


09-SEP-1998 
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CC The invention relates to an isolated PRO polypeptide (secreted or 
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Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I i I I I I I I I I I I I II I I I I I I I I I I I i I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

1 1 1 i I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 



Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I I I I I I I I I I I M i I I I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I II I I I I I I I 1 1 I I I 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T G GAT AT C C AGGAT C CAGGGGT CC CCAGGCTAAAGAAC AT GAT AC C GT GGC C AGC C A 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 361 C CT T GGAT AT C CAGGAT C C AGGG GT C CC C AGG CTAAAGAAC AT GAT AC C GT G GC CAGC CA 42 0 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGAC AC AGT GTT T C A 480 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGAC AC AGT GTT T C A 480 

Qy 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAG GT C AT GGAGG GAAAAG GC C AAAGC C CCTT T GAC C CCGC T C ACAAGCATAC G G 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 661 CT GTCTT GGT GGAT GGGAT GCT CT AT T CT GGTACTAT GAACAACTT CCT GGGCAGT GAGC 72 0 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II I I I I II I I I I I I I I I 
Db 721 C CAT C CT GAT GC GCACACT GG GAT C C CAGC CT GT C CT CAAGACC GACAACT T C CT CC GCT 78 0 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 841 T CT T C GAG GAGACAG C CAGC GAGT T T GACT T CT TT GAGAGGCT C CACAC AT C GCGGGT GG 900 

Qy 901 CTAGAGT CT GCAAGAAT GACGT GGGC GGCGAAAAGCT GCT GCAGAAGAAGT GGACCAC CT 960 

I I I I I I I I I I M I I I I I I I I I I I I II I II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I 
Db 901 CTAGAGT CT GCAAGAAT GAC GT G GG C GG CGAAAAGCT GCT GCAGAAGAAGT GGAC CAC C T 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 



Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I M I I I I I i I 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I i I M I I I I I I I II I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | || | | | | M I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

Qy 1141 TT GAACGT GTCTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACT A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I M I I I I I I I I I I I I I I I I I I I I 
Db 1141 TTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTA 1200 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 1261 AT AAGG C C CT GAC CT T CAT GAAG GAC CAT T T C CT GAT GGAT GAGCAAGT GGT GGGGAC G C 1320 

I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1261 ATAAGGC C CT GAC CTT C AT GAAGGAC CAT T T C CT GAT GGAT GAGCAAGT G GT G GG GAC GC 1320 

Qy 1321 C CCT GCT GGT GAAAT CT GGC GT GGAGTAT ACAC GGCTT GCAGT GGAGACAGC CCAGGGCC 138 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CC CT G CT GGT GAAAT CT GG C GT GGAGTAT AC AC GGCTT GCAGT GGAGACAGC C CAGG GC C 1380 

Qy 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

Qy 1441 CTGT GGTAAGT GGGGACAGCAGT GCT CATCTGGT GGAAGAGATT CAGCT GTT C C CTGACC 1500 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I | I I I I I I I 

Db 1441 CTGTGGTAAGT GGGGACAGCAGT GCT CATCTGGT GGAAGAGATT CAGCT GTT CCCT GAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 15 60 

Qy 1561 CAGGAGGT GTCTGGAGGGT GCCCCGAGCCAACTGTAGT GT CT AT GAGAGCT GTGT GGACT 162 0 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I | | I | | I I I I 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | || I I | I I I I I 
Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1741 CAT GT GC CAGT GGC C C CAT GAGC AGGAG CCTTCGGCCT C AGAG C C G C C C GCAAAT CATT A 18 00 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 



Qy 1861 TGGCCTCT TAT TAT T G GAGT CAT G GC C CAG CAGCAGT C C CAGAAGC CT CT T C CACT GT CT 1920 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

M I I I I I I I M I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 1981 CAACT GAGAAT GGCT TT T C AT AC CC T GT GAT CT C CT AC T G GGT GGACAGC CAGGAC C AGA 2040 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I ! I I I I I 
Db 1981 CAAC T GAGAAT GGCT TT T CAT AC C CT GT GAT CT C CT ACT GGGT GGAC AG C CAGGAC C AGA 2040 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I | I | | 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I M I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

I M I I I I I I I I I I I I II I I I I I I I I I I II I II I I I I II I I I I I I I I I I I I II I I I II II I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

Qy 22 81 AGAAGGC C C C GTTAAGCAGAGAGCAAC AC C T C C AGT CT C C CAAGGAAT GCAGGAC CT CT G 234 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGT CT CCCAAGGAAT GCAGGAC CT CT G 2340 

Qy 2341 C C AGT GAT GT G GAC GCT GACAACAACT GCCTAGGCACT GAGGT AGCT T AAACT CT AGGC A 2400 

I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I II I II I I I I I I II II I I I I I I I I I I I I 
Db 2341 C CAGT GAT GTGGACGCT GACAACAACT GC CT AGGCACT GAGGT AGCT TAAACT CTAGGCA 2400 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2520 

I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 2461 T GAC TAG GAT GAC AG CAGCACAAAAGAC CACC TT T CT C C C CT GAGAGGAGCTT CT GCT AC 2520 

Qy 2521 T CT GC AT CACT GAT GAC ACT CAGC AGGGT GAT GCACAGCAGT CTGCCTCC C CT AT GGGAC 2580 

I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 2521 T CT GC AT CACT GAT GAC ACT CAGC AG G GT GAT GCACAGCAGT CT GC CT CCC CT AT GGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

I I I I I I II M I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2641 T ACACTGATATT GAAGAACCT GGAGAGGAT CCTT CAGTTCTGGCCATTCCAGGGACCCT C 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I It I I I I I I I I I I I I I I I I I II I I I I I I II I I I II 
Db 2 641 T ACACTGATATT GAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCAT TCCAGGGACC CT C 2700 

Qy 2701 C AGAAAC ACAGT GT T T C AAGAGAC C CT AAAAAAC CTGCCTGTCC CAGGAC C CT AT G GT AA 2760 



Db 2701 CAGAAACAC AGT GT TT CAAGAGAC C C TAAAAAAC CT GC CT GT CC C AGGAC CCTAT G GTAA 2760 

Qy 2761 T GAACAC CAAACAT CTAAACAAT CAT AT GCTAACAT GCCACT C CT GGAAACT CCACT CT G 2820 

I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! II I I I I I I M I I I I I I I I 

Db 2761 T GAACAC CAAACAT CTAAACAAT CAT AT GCTAACAT GCCACT CCT GGAAACT CCACT CT G 2820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I I I I 

Db 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

II I I I I I I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I II 

Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I II I I I I I I I I I I I I I I I I 

Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 14 
ADE20178 



ID ADE20178 standard; cDNA; 3143 BP. 
XX 

AC ADE2 0178; 
XX 

DT 29-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PR01317. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 

XX 

OS Homo sapiens. 
XX 

PN US2003092883-A1. 
XX 

PD 15-MAY-2003. 
XX 

PF 10-DEC-2001; 2 001US-000 134 30 . 
XX 
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PT New isolated PRO polypeptide useful for tissue typing, modulating 



PT biological activity of cell, as molecular weight markers in protein 

PT electrophoresis, for treating arthritis and tumors. 

XX 

PS Claim 2; SEQ ID NO 276; 555pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
Qy 1 GGGCT GAGG CACT GAGAGAC C G GAAAGC CT GGC AT T C CAGAG GGAGG GAAAC GC AGC GG C 60 

I I I M I ! I I I I I i I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 1 I I I II i I I I I I I I I I I I I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

M II I I I I I II I I I I I I I I I I I I I I I I I | | | | I | | | | | | | M I I I I I I I I I I I I I I I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | M | | | || | | | | | | | | | | | | | | | | | 
Db 181 T G CC GAC GAC GACC GC GGGGGGAGGC GG GC AGG GGC C C AT GC C CAGGGT C AGAT ACT AT G 24 0 

Qy 241 CAG GGGAT GAAC GT AGGGC AC TT AGCTT CTT C CAC CAGAAGG GC CT C CAGGATT T T GAC A 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I 

Db 241 CAGG GGAT GAAC GT AG GG CACTT AGCTT CT T C CAC CAGAAG GGC CT C C AGGAT T T T GAC A 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

M I I I II I I I I I I M I I I I I I I I I I I I It I I I I I I I I I I | | | | | | | || M | | || M || | | 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
Db 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 420 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT GCC TT TAAGAAGAAGAGCAAT GAGACACAGT GTT T C A 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 421 GT GAC AGAAAAAAGAGT GAAT GT G C CTT TAAGAAGAAGAG CAAT GAGACACAGT GTT T C A 48 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I M I I I I I I I I I I I I i I I I I I I I I | | | | I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTC7\AGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I 
Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 



Qy 



661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 
I I I I I I I I I I M I M II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I 



Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

I I M I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 721 C C AT CCT GAT G C G CACACT GG GAT C C C AG CCT GT C CT CAAGAC C GACAACT T CCTCCGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I II I I I I I I I II I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | 
Db 841 T CTT CGAGGAGAC AGC CAGC GAGT T T GAC T T CT T T GAGAG GCT C CACACAT CG C G G GT G G 900 

Qy 901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

I M I I I I I I I I M I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CT AGAGT CT G CAAGAAT GACGT GGGCG G C GAAAAG CT GCT GC AGAAGAAGT GGAC CAC C T 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I Ml I I I I II II I I I I I I I I 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I M I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | || I I I I I I I I I I I I I I 

Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 TT GAACGTGTCTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACT A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 TT GAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTT CACGCT GGACT A 12 00 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 1261 AT AAG GC CCT GAC CT T CAT GAAGGACCAT T T C CT GAT GGAT GAGCAAGT GGT GGG GACGC 1320 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I M II II I I I 
Db 1261 ATAAGGC CCT GAC CT T CAT GAAG GAC CAT T T C CT GAT G GAT GAG CAAGT GGT GGGGACGC 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 T T GAT G GGCACAGCC AT CTT GT CAT GT AC C T GGGAACC AC CACAGGGT C GCT C CACAAG G 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | I I I I I I I I I I I II I I 

Db 1381 T T GAT GG GC ACAG CCAT CT T GT CAT GT ACCT G GGAAC CAC CACAGGGT C GCT C CACAAGG 14 4 0 

Qy 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 15 60 

I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I I II II I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 



Qy 


1561 


CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAA.CTGTAGTGTCTATGAGAC;rT(^TnTr;^ArT 

1 1 M 1 1 1 1 1 1 1 i 1 II 1 1 1 1 i 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 

CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 


1 690 

10<cU 


Db 


1561 


i 6 9 n 


Qy 


1621 


GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 
1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | | | | | | | | | | 
GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 


1 6R0 
1GOU 


Db 


1621 


1680 


Qy 


1681 


T GT CT GC C CC CAAC CT GAACT C CT GGAAGCAGGAC AT GGAG C GG GG GAAC CCAGAGT G GG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 

TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 


1740 


Db 


1681 


1740 


Qy 


1741 


CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 18 00 

1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 


Db 


1741 


Qv 


1801 


AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 
1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II I I || | | | | M 1 1 
AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 


1860 


Db 


1801 


1860 


Qy 


1861 


TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 
M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
T GGC CT CT TAT TAT T GGAGT CAT GGC C CAGC AGCAGT CC CAGAAGC CT CT T C CACT GT CT 


1920 


Db 


1861 


1920 


Qy 


1921 


ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 
1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II M 1 1 II 1 1 1 II II I 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 II 
ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 


1980 


Db 


1921 


1980 


Qv 


1981 


CAACTGAGAAT GGCTTTT CAT ACCCTGTGAT CT CCTACT GGGTGGACAGCCAGGACCAGA 

1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CAAC T GAGAAT GGCT T T T CAT AC C CT GT GAT CT CCTACT GGGT G GAC AGC C AGGAC CAGA 


2040 


Db 


1981 


2040 


Qv 


2041 


C i CC T V(ZCZC t C t C ,s mCZ ATP PTP A APT r*r*r*Ar' PP A TTTTT* PPPr* ArPAmrrnr^ 7\ r , r , rnr t r*rT*rnrnr i t\ 
^^v^J. vjjkj^k^ i ijtai-ii lli UUUUUbfCjbACjCAl OJ. GAA.GGTCCCGTTGA 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | 
CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 


2100 


Db 


2041 


2100 


Qy 


2101 


CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 


2160 


Db 


2101 


2160 


Qv 

« J: 


2161 


CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 
M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 
CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 


2220 


Db 


2161 


2220 


Qv 


2221 


CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 
M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 
CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 


2280 


Db 


2221 


2280 


Qy 


2281 


AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 

MM 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGAAGG C C CC GT T AAGC AGAGAG CAAC AC CT C C AGT CT C C C AAGGAAT GCAG GAC C T CT G 


2340 


Db 


2281 


2340 


Qy 


2341 


CCAGT GAT GT GGACGCT GACAACAACT GC CTAGGCACTGAGGTAGCTTAAACT CTAGGCA 

M 1 I 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 I I I | | | M 1 1 1 1 1 1 1 1 1 1 1 1 1 

C CAGT GAT GT GGAC GCT GACAACAACT G C C TAG G CAC T GAGGT AGCT T AAACT C T AGG C A 


2400 


Db 


2341 


2400 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2401 



2401 



CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 
I M I I II I I II I I I I I II I | | | | | | | | || | | | | | | | | | | | | || | | | | | | | | | | | 

CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 



2461 T GACTAGGAT GACAGCAGCACAAAAGACCACCTT T CT CC CCT GAGAGGAGCTTCTGCTAC 2520 

I I I I I I I I I I I I I I M I II I I I I I I I I I I | | | | | | | | | | | | | | | | | | || | | || | | | || | | 

2461 T GACTAGGAT GACAGC AGCACAAAAGAC CACCTTT C T C C CCT GAGAGGAG CT T CT GC TAC 2520 
2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GC CTCC CCTAT GGGAC 2580 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

2521 TCT GCAT CACT GAT GACACTCAGCAGGGTGAT GCACAGCAGT CT GC CT CC CCTAT GGGAC 2580 
2 581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 



2640 



2641 



TACACTGATATT GAAGAACCT GGAGAGGAT CCT T CAGTT CTGGCCATT CCAGGGACC CT C 2700 
I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I | | I | | | | | || I I I I 
2 641 TACACT GATATT GAAGAACCT GGAGAGGAT CCTT CAGTT CTGGCCATT C CAGGGACCCT C 2700 



2701 



2701 



2761 



CAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGTCCCAGGACCCTATGGTAA 2 760 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

CAGAAACACAGT GTT T CAAGAGAC C CT AAAAAAC CTGCCTGTCC CAGGAC C CT AT GGT AA 2760 



T GAAC AC CAAAC AT C T AAACAAT CAT AT GCTAACAT GCCAC T C CT GGAAAC T C CACT CT G 2820 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

2761 T GAACAC CAAAC AT CTAAACAAT CAT AT GCTAACAT GCCAC T CCT GGAAACT C CACT CT G 2820 

2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 8 8 0 

I I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | || | | | | | | 
2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I I I I I I I I II I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3 000 
3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | | | | M I I I I I I I II II I I I I 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I | | | | | | | I I I I I I I I I I I I I I I I I I | | | | | | | | | I I I I I 
3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 
3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 15 
ADE50089 

ID ADE50089 standard; cDNA; 3143 BP. 
XX 



AC 


ADE50089; 




XX 






DT 


29-JAN-2004 


(first entry) 


XX 




DE 
XX 


Human cDNA 


encoding secreted/ transmembrane protein PR01317. 


KW 


Human; ss; 


gene; secreted protein; transmembrane protein; PRO; tumour; 


KW 


immune response; cardiac insufficiency disorder; calcium flux; 


KW 


umbilical vein endothelial cell; bone disorder; cartilage disorder; 


KW 


arthritis; 


wound healing; diabetes; skeletal muscle cells; obesity; 


KW 


Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease 


KW 


dermatitis ; 


herpetiformis; Crohn's disease; thalassaemia . 


XX 






OS 


Homo sapiens. 


XX 






PN 


US2003082626-A1. 


XX 






PD 


01-MAY-2003 




XX 






PF 


06-DEC-2001 


; 2001US-00006116. 


XX 






PR 


01-SEP-1998 


98US-0098716P. 


PR 


01-SEP-1998 


; 98US-0098723P. 


PR 


01-SEP-1998 


98US-0098749P. 


PR 


01-SEP-1998 


98US-0098750P. 


PR 


02-SEP-1998 


98US-0098803P. 


PR 


02-SEP-1998 


; 98US-0098821P. 


PR 


02-SEP-1998 


98US-0098843P. 


PR 


09-SEP-1998 


98US-0099536P. 


PR 


09-SEP-1998 


98US-0099596P. 


PR 


09-SEP-1998 


; 98US-0099598P. 


PR 


09-SEP-1998 


; 98US-0099602P. 


PR 


09-SEP-1998 


98US-0099642P. 


PR 
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Novel isolated PRO polypeptides useful for tissue typing, modulating 
bxological activity of cell, as molecular weight markers in protein 

Query Match 100.0%; Score 3143; DB 9; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
Q y 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I I M I I I I I I I I I I I I I I I I I I I | | | | I I I I I I M II I t I I I I I I I I I I I I | | | | | | 

Db 1 GGGC T GAG GCACT GAGAGAC C G GAAAGC CT GGCAT T C CAGAG G GAGG GAAAC GC AG C GG C 60 

QY 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I I I I I N I I I I I I I I I I I I I I I | | | M I I I I I I I I M I I I | | | | II I I I I I I I I I I I I I 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

QY 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

1 I I I I I I I I I I I I I I | | | | | M I I I I I I I I I I I | | | I I I I II I I I I I I I | | I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I I I I I I I II I I I I I I | | | | | | | | | I I I I I M I I I I I I I II I I I I I I I I I I 
Db 18 1 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | 

Db 241 CAGG GGAT GAAC GTAGG GCACT TAGC TT CTT C CAC C AGAAGG GC CT CC AGGAT T TT GAC A 300 

Q y 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I II I I I I I I M I | | | | | | | | I I I I I I I I I II i I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 



Qy 



361 CCTT GGAT AT C CAGGAT C CAGGGGT C C C CAGGC T AAAGAACAT GAT AC CGT G G C C AGCC A 420 



361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 420 

421 GTGACAGAAAAAAGAGTGAATGTGCCTTTAAGAAGAAGAGCAATGAGACACAGTGTTTCA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I | | | | | | | | M | | | 

421 GTGACAGAAAAAAGAGTGAATGTGCCTTTAAGAAGAAGAGCAATGAGACACAGTGTTTCA 4 80 

4 8 1 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 
I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I 

541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I | | | | | | | | | | | | 
661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I 
721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I N I I I I I I I I I I I I I I I II I I I I I | | I I I I | | | | | | | | | | 

781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 9 00 
I I I I I I M I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | I I 

901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | 
961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

1141 TTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTA 1200 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | 

1141 TTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTA 1200 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 



1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

'I I I I I I II I II I I I I II I II I I I I M I I I I I II || | | || | | || | | | || | | | || | | | | , | 
12 61 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I IN I I I II I I I I I III I I I II I I III I I I I I I I I I I I | | | | 

132 1 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 



1381 



1440 



TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 

1 1 1 1 1 1 1 1 ii i in i ii ii 1 1 1 1 1 mi 1 1 iii i ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 



1441 



1500 



CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 

I MM Ml MM MINIMI III MINI Mill III I III I I III MM,, 

1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 



1560 



1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 

I I I I I I N I I M II II M I II I I I I I II I I I I || | | | | | | | | | || | | | | | | | || | | | , | | 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

' I I I I M M I I I II II II I II I I I I I II I I I I II M I I I I I II I I I II II II I I I 

CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 



1561 



1 62 1 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I H I M I M I I I I I II M I M II I II I I I I | | || | || | | | || | | || | | | | | | | | | n | | 
1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

" I I ' I I I I I I HI I II II MM I III I MM I || I | | Ml II I III I II I II II I II I I 

TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 



1681 



1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

"I I 'I II I M M M I I I II I I I M I II II II II II I II II I II II II II I I I I 

CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 



1741 
1801 
1801 
1861 



1800 
1860 



AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 
' ' ' ' ' ' ' I I I I I I I I M I I II II I II I II II I II II II II II II II II I I II I I II II II 
AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 



TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I 1 I I M I I II II II II II I II II I I I I || | | M II I II II II II I II II II I 

1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I M I I II II II II II I I I II II II II I II II II I I II || || || || M I I I II 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 2040 

in M M II II II II II II II II || I || || | | | | || | || || | || M II M I II I I II 

1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 2040 



2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 
" I I I 1 I I I I I I I I II M II II II II II II II I II II I II II II II II I || | || || || | | 
CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 



2041 



2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 



11 II I I I I I I I I I I I II I I I I I I I I | IN | | | || | | || | | | 



2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

' I I I I I I | | | M | I I I I I I I I II I I I II I I II II I I I M I I I I I I I II I I I I I I I M I I I 
2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

000 , I ''I I I I II I I I II I I I IN I I II I I I I || I I I II II I I II I I II I | || II I I II 

2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 2340 



1 1 1 I I I I I I I I N I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCTG 234 0 



2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACC 



2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 

00/1 lllll| IIIIIIIIIIIMIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII||||||||l 

2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 
24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

OJA „ 11 I I I I Ml I I I I II I I III I I I I I I I I I I I I I I II I I II I I I III I II I I I I I I I I I I I 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 
24 61 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2520 

^ 1111 1 I I" I I I IN I MM I I I I I I I I I I I I I III I Nil I I II I I I I I I I I II I I I I I 

2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 252 0 
2 521 TCTGCATCACTGATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGAC 2580 

'HIIIIIIIIIIIIMIIIIIMIIIIIIIMIIIIIIIIIIIIIIIIIIIIIIIIIII 

AC 2580 



2521 TCTGCATCACTGATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGG. 



2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 



2581 
2641 
2641 
2701 



"IIIIIIIIIIIIIIMIIIIIIIMIIIIIIIIIIIIIIMIIIIIIIIMIII 

TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

TACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | M I I I I I I I I I I I I | | | | 

TACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTC 2700 



CAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGTCCCAGGACCCTATGGTAA 2760 
„ ni I I I I I I I I I I I I I I I | | | | M I I I I I I I II I I I I I I I I I | | | | | | | | | I I I I I I I I I I I I 
2701 CAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGTCCCAGGACCCTATGGTAA 2760 

2761 TGAACACCAAACATCTAAACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTG 2820 

1 11 1 1 1 " I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I 
2761 TGAACACCAAACATCTAAACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTG 2820 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

ooon 1 11111 I 'I I I I I "I I I II I I I I I I I I Ml I II I II I III I I I I II I I I I I I I II | | | | 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

ooon 1 1 1 11 ' I "I I I I Ml I UN I I I M I I I II I I I I II | I I I I I I Ml | || || | | II I I I I 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 



Qy 


2941 


CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 

1 1 M 1 M 1 i 1 1 1 I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 


3000 


Db 


2941 


3000 


Qy 


3001 


CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I M 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | M | | | | | 
CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 


3060 


Db 


3001 


3060 


Qy 


3061 


TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 I | | | | 
TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 


3120 


Db 


3061 


3120 


Qy 


3121 


TAAAAATATAAGGCTTAAAAAAA 3143 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 
T AAAAAT AT AAG G CT TAAAAAAA 3143 




Db 


3121 





Search completed: May 13, 2004, 10:04:06 
Job time : 1169 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Cornpugen Ltd. 



OM nucleic - nucleic search, using sw model 

Run on: May 13, 2004, 09:33:13 ; Search time 212 Seconds 

(without alignments) 
8227.409 Million cell updates/sec 

Title: US-10-015-391A-276 
Perfect score: 3143 

Sequence: 1 gggctgaggcactgagagac aaatataaggcttaaaaaaa 3143 

Scoring table: 

Searched: 



IDENTITY_NUC 
Gapop 10.0 , Gapext 1.0 

682709 seqs, 277475446 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



1365418 



Database : Issued_Patents_NA: * 

1: /cgn2_6/ptodata/2/ina/5A_COMB.seq: * 

2 : /cgn2_6/ptodata/2/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/2/ina/6A__COMB. seq: * 

4: /cgn2_6/ptodata/2/ina/6B_COMB. seq:* 

5 : /cgn2_6/ptodata/2/ina/PCTUS_COMB. seq: * 

6 : /cgn2_6/ptodata/2/ina/backf ilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 

US-09-300-958A-24 

; Sequence 24, Application US/09300958A 

; Patent No. 6495319 

; GENERAL INFORMATION: 

; APPLICANT: McClelland, Michael 

; APPLICANT: Welsh, John 

; APPLICANT: Trenkle, Thomas 

; TITLE OF INVENTION: Reduced Complexity Nucleic Acid Targets and Methods of 
; TITLE OF INVENTION: Using Same 
; FILE REFERENCE: P-PH 3457 

; CURRENT APPLICATION NUMBER: US/ 09/300 , 958A 

; CURRENT FILING DATE: 1999-04-27 

; PRIOR APPLICATION NUMBER: 60/083,331 

; PRIOR FILING DATE: 1998-04-27 

; PRIOR APPLICATION NUMBER: 60/098,070 

; PRIOR FILING DATE: 1998-08-27 

; PRIOR APPLICATION NUMBER: 60/118,624 



; PRIOR FILING DATE: 1999-02-04 
; NUMBER OF SEQ ID NOS : 85 
; SOFTWARE: Patentln Ver . 2.0 
; SEQ ID NO 24 

LENGTH: 2433 

TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-300-958A-24 

Query Match 7.3%; Score 230; DB 4; Length 2433; 

Best Local Similarity 50.2%; Pred. No. 4.5e-51; 

Matches 906; Conservative 0; Mismatches 805; Indels 93; Gaps 10 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 53 CCCTTCTGCTGAGCCAGGATGGAAAGACGCTGTATGTGGGGGCCCGAGAGGCCCTCTTTG 112 

Qy 361 CCTTGGATATCCAGGATCCAGGGGTCCC CAGGCTAAAGAACAT GAT ACCGT GGCCAG 417 

I I I I I I III III II I I II I I I I I 

Db 113 CACTTAACAGCAACCTCAGCTTCTTGCCAGGCGGGGAGTACCAAGAGCTACTGTGGAGTG 172 

Qy 418 C CAGT GAC AGAAAAAAGAGT GAAT GT GC CTT T AAGAAGAAGAG CAAT GAGAC AC AGT GTT 477 

I II I III III I I I I I I II I I II I I I I 

Db 173 CAGAT G CT GACAGGAAGCAGCAGT GC AG CT T CAAGGGCAAGGAC C CAAAGC GT GACT GT C 232 

Qy 478 TCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCT 537 

I I I I II I I MM I I III I I II I I I M I M 1 I I I I I 

Db 233 AAAACT AC AT CAAGAT CC T C CT GC C ACT CAACAGCAGCC AC CT GCT C AC CT GT GGCAC GG 2 92 

Qy 538 TCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCT 597 

I I II I I I I II II II I I I II I I I I I I I 

Db 2 93 CCGCCTTCAGCCCCCTGTGTGCTTACATTCACATAGCGAGCTTTACTTTAGCCCAAGATG 352 

Qy 598 CGGAGGACAAGGTCAT GGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACA 651 

II I II I I I I I I II I I I I I I I I I I I I I I II I I I II M 

Db 353 AGGCCGGTAATGTCATTCTGGAGGATGGCAAGGGTCATTGTCCCTTTGACCCCAACTTCA 412 

Qy 652 AGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGG 711 

I I I I M I I I I I I I I I I I I Mill I I II I I II t II I II I I 

Db 413 AGTCCACGGCTCTGGTGGTTGATGGTGAGCTGTACACTGGAACAGTCAGTAGCTTCCAGG 472 

Qy 712 GC AGT GAGC C CAT C CT GAT GC GCACACT GGGAT C C CAGC CT GT CC T CAAGACC GAC AACT 7 71 

II MM II II I I I I I II I M I I I II I I I I I I I 

Db 47 3 GAAACGACCCAGCCATTTCCCGGAGCCAGAGTTCCCGCCC CACCAAGACT GAGAGCT 529 

Qy 772 TCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCG 831 

MM I M II I II I II II II I I I I I I II 

Db 530 CCCTCAACTGGCTACAAGACCCTGCCTTTGTGGCCTCGGCTACGTCCCCCGAGAGCCTGG 5 89 

Qy 832 T CT ACT T CTT CT T C GAGGAGACAGCCAGC GAGT 8 64 

II II I I I I I II II I Mill I I MM 

Db 590 G C AGC C C CAT AGGT GAT GAT GAT AAGAT CT ACT T CTT CT T CAG C GAGAC GGGC CAG GAGT 64 9 

Qy 865 TT GACT T CT T T GAGAGGCT C CACACAT C GCG GGT GGC T AGAGT CT GCAAGAAT GAC GT GG 924 

I M I II I I I I I I II I I I I I I I I II I M I II I I II Mill 

Db 650 TT GAGT T CT T T GAGAACACCAT C GT GT C C C GAGT T GC C C GAGT CT GT AAGG GC GAT GAG G 709 



Qy 925 GCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTG7VAGGCCCAGCTGCTCTGCA 984 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || 

Db 710 GTGGAGAGCGGGTGTTGCAGCAACGCTGGACCTCCTTTCTCAAGGCTCAGCTCCTGTGCT 769 

Qy 985 CCCAGCCGGGGCA GCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCG 1041 

I N til I I I I I I I I I I I I I II || || || |M 

Db 770 CCCGGCCTGATGATGGCTTTCCCTTTAACGTGCTACAAGATGTCTTCACCCTGAACCCCA 829 

Qy 1042 ATTCTCCCACAGCTCCCCACATCTA CGCAGTCTTCACCTCCCAGTGGCAGGTTG 1095 

I I N I I I I I II I I I I I I I I M I I I I I I I I I I 

Db 830 ACCCTCAGGATTGGCGCAAGACCCTTTCTATCGGGGTCTTTACCTCCCAGTGGCACAGAG 889 

Qy 1096 GCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTA 1155 

I M I I I I I I I I I I I I I I I I I II | | | | | | | 

Db 890 GGACCACAGAAGGCT CT GCCATCT GC GT CTT CAC CAT GAAT GAT GTGCAGAAGGC CTTT G 94 9 

Qy 1156 AGG GGAAAT ACAAAGAGT T GAACAAAGAAAC TT C AC GCT GGACT ACT T AT AGGGG C C CT G 1215 

Ml I II I I I I I I I I I M | | | Ml IN || || | 

Db 950 ACGGC CT GTACAAGAAAGTAAACAGAGAGACACAGCAGT GGTATAC CGAGACCCACCAGG 1009 

Qy 1216 AGACCAACCCCCGGCCAGGCAGTTG CT 1242 

I M I I I I I I I I II II || 

Db 1010 T GCC CACACC GC GGC C GG GAGC GT GC AT T AC CAACAGT GC C C GGGAACG GAAGAT CAAC T 1069 

Qy 1243 CAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATG 1302 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 107 0 CGTCCCTGCAGCTCCCAGACCGAGTGCTGAACTTCCTCAAGGATCACTTCTTGATGGATG 1129 

Qy 1303 AGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAG 1362 

III II I I I II I I I I I I I II I I M INI 

Db 1130 GGCAGGTCCGCAGTCGCCTGCTGCTGCTGCAGCCCAGAGCCCGCTACCAGCGTGTGGCTG 1189 

Qy 1363 T G GAGACAGC CCAGGGCCTT GAT G GGCACAG CCAT CT T GT CAT GT AC CT GGGAAC CAC CA 1422 

Ml I I I I I M I I II | || Mill || 

Db 1190 TGCACCGTGTGCCTGGCCTGCACAG CACTTATGATGTCCTATTTCTGGGCACTGGTG 124 6 

Qy 1423 CAGGGT C GCT CCACAAGGCT GT GGTAAGTGGGGACAGCAGT GCT CAT CT GGT GGAAGAGA 1482 

I I II II I I I I I I I I | || | || | | | I 

Db 1247 ATGGCCGCCTGCACAAAGCAGTG AC C CT GAGCT C CAGAGT C CACAT CAT T GAGGAGC 1303 

Qy 14 83 TTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTG 1542 

I I M II M I I II I lllll I I I II II I MM I III 

Db 1304 TGCAGATCTTCCCTCAAGGACAGCCTGTGCAGAACCTGCTCTTGGACAGCCATGGGGGAC 1363 

Qy 1543 CAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCT 1602 

I I I I I III MM I M I II I II || II II II I II 

Db 1364 TGTTGTATGCCTCCTCCCATTCCGGGGTGGTGCAAGTGCCCGTAGCCAACTGCAGCCTGT 1423 

Qy 1603 ATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGT 1662 

I MUM Mill II II II II II I I II I I I II I II I I 

Db 1424 ACCCAACCTGTGGAGACTGCCTCCTGGCTCGAGACCCCTACTGCGCCTGGACTGGCTCTG 1483 

Qy 1663 CCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGC 1722 

I I I I I II I II II II I II II I lllll 

Db 14 84 CCTGCAGGCTCGCTAGCCTCTACCAGCCTGATCTGGCCTCCAGGCCATGGACCCAGGACA 1543 

Qy 1723 GGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGA 1782 



Ill i I I Mill 

Db 1544 TT GAGGGT GC CAGT GT CAAGGAACT CT GCAAGAATT CCT CAT ACAAGGCCCGGT TT CTTG 1603 

Qy 1783 GCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCT 1842 

I I i I I I I I I I I I I I I II I I I Mill 

Db 1604 T GCC AG GT AAGC C AT GT AAACAAGT C C AGAT C CAAC CAAAC AC AGT GAAC AC CCT G G C CT 1663 

Qy 1843 GCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAG 1902 

II M I I 11 I I I I I M M II III II III Mill I 

Db 1664 GCCCACTCCTCTCAAACCTGGCCACTCGGCTCTGGGTGCACAATGGAGCCCCAGTCAATG 1723 

Qy 1903 AAGCCTCTTCCACTGTCTA CAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAG 1956 

I I M I | MM I I I I I I I I I I I I 

Db 1724 CCTCTGCCTCCTGCCGCGTGTTACCCACCGGGGACCTGCTGCTGGTGGGCAGCCAGCAGG 17 83 

Qy 1957 TTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCT 2016 

I Ml I I I I II M I I I I I M I I I II I I I M I I II 

Db 1784 GTTTGGGGGTGTTCCAGTGTTGGTCGATAGAAGAAGGATTCCAGCAGCTTGTGGCCAGCT 1843 

Qy 2017 ACTG 2020 

I I I I 

Db 1844 ACTG 1847 



RESULT 2 

US-08-556-422A-1 

Sequence 1, Application US/08556422A 
Patent No. 6576754 
GENERAL INFORMATION: 
APPLICANT: HALL, Kathryn T. 
APPLICANT: FREEMAN, Gordon J. 
APPLICANT: SCHULTZE, Joachim L. 
APPLICANT: BOUSSIOTIS, Vassiliki 
APPLICANT: NADLER, Lee M. 

TITLE OF INVENTION: NUCLEIC ACIDS ENCODING CD100 MOLECULES 
FILE REFERENCE: DFN-005CPA2 

CURRENT APPLICATION NUMBER: US/ 08/556, 422A 
CURRENT FILING DATE: 1995-11-09 
NUMBER OF SEQ ID NOS : 7 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 1 
LENGTH: 4157 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME /KEY: CDS 
LOCATION: (88) . . . (2673) 
US-08-556-422A-1 



Query Match 4.9%; 
Best Local Similarity 50.0%; 
Matches 743; Conservative 



Score 153.4; DB 4; 
Pred. No. 1.4e-30; 
0; Mismatches 636; 



Length 4157; 
Indels 108; 



Gaps 10; 



Qy 



Db 



270 T T C C AC C AGAAGGGCC T C C AGGAT T T T GAC AC TCTGCTCCT GAGT GGT GAT GGAAAT ACT 329 

MM M I I II I II I I I I I I II II I II Ml 

211 T T T CAT GAGC C AGAC AT CTACAACT ACT CAGC CTTGCTGCT GAGC GAGGACAAGGAC AC C 270 



Qy 330 CTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCC 389 

I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 271 TTGTACATAGGTGCCCGGGAGGC GGTCTTCGCTGTGAACGCACTCAACATCTCC 324 

Qy 390 AGGCTAAAGAACAT GAT AC C GT GGCCAGC CAGT GACAGAAAAAAGAGTGAAT GT GC CTTT 449 

I I 1 I M I I I II II I I I I I I I I I I I I 

Db 325 GAGAAG C AG CAT GAGGT GT AT T GGAAGGT CT C AGAAGACAAAAAAG CAAAAT GT GCAGAA 384 

Qy 450 AAGAAGAAGAG C AAT GAGAC AC AGT GT T T C AACT T CAT CCGTGTCCTGGTTTCT T ACAAT 509 

III III II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 385 AAGGGGAAAT CAAAAC AGACAGAGT GC CT CAACT ACAT C C GGGT G CT GCAG C C ACT C AGC 44 4 

Qy 510 GTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAA 569 

I I I I Mill I I I I I I I Mill! M I I I I I I II I 

Db 445 GCCACTTCCCTTTACGTGTGTGGGACCAACGCATTCCAGCCGGCCTGTGACCACCTGAAC 504 

Qy 570 CTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAA 629 

I I I I I I I I M II I I II II I I 

Db 505 T T AACAT C CT T T AAGTT T C T GGG GAAAAAT GAAGAT GGCAAAGGAAGA 552 

Qy 630 AGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCT 689 

I II II II M I M I I II M III I I II I I I I II II I II I I M I 

Db 553 TGTCCCTTT GAC C C AGCACACAGCT AC ACAT C CGT CAT GGT T GAT G GAGAACTT T ATT CG 612 

Qy 690 GGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAG 749 

I I II I I II I I I M I I M M I I II II I M I I 

Db 613 GGGACGTCGTATAATTTTTTGGGAAGTGAACCCATCATCTCCCGAAATTCTTCCCACAGT 672 

Qy 750 CCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCA 809 

I I I I I I Ml I I III I Mill 

Db 673 C CT CT GAG GAC AGAATAT GCAAT CCCTTGGCT GAAC GAG CCT AGT T T C GT GT TT GCT GAC 7 32 

Qy 810 GC CAT C C CT T C GAC C C AGGT C GTCTACTTCTTCTTC 845 

I I I I I III II I I II II II II I I II I 

Db 733 GT GAT C C GAAAAAGC CC AGAC AGC C C C GAC GGC GAGGAT GAC AGGGT CT ACT T CTT CT T C 7 92 

Qy 846 GAGGAGAC AGC CAGC GAGT T T GACTT CT TT GAGAG GCT C CACACAT C GC GGGT GGCT AGA 905 

II I I I II M I I I M I I II I I I I I II I II I II 

Db 793 ACGGAGGT GT CT GT GGAGTAT GAGTTTGT GTT CAGGGT GCT GAT CC CAC GGATAGCAAGA 852 

Qy 906 GT CT GCAAGAAT GACGT GGGC GGC GAAAAGCT GCT GCAGAAGAAGT GGAC CACCTT CCT G 965 

I I M II II III I I I I I II II I II I II II II II II II I II II I II 

Db 853 GTGTGCAAGGGGGACCAGGGCGGCCTGAGGACCTTGCAGAAGAAATGGACCTCCTTCCTG 912 

Qy 966 AAGGCCCAGCTGCTCTGCACCCAGCCGG GGCAGCTGCCCTTCAACGTCATCCGCCAC 1022 

I I M I I II I II I I M I II I I I II I II M I II III I 

Db 913 AAAGCCCGACTCATCTGCTCCCGGCCAGACAGCGGCTTGGTCTTCAATGTGCTGCGGGAT 972 

Qy 1023 GCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCC 1082 

I II II I II II I I I II II II I I I I II I II II I 

Db 973 GTCTTCGTGCTCAGGTCCCCGGGCCTGAAGGTGCCTGTGTTCTATGCACTCTTCACCCCA 1032 

Qy 1083 CAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATT 1142 

I M I I I I I I I II I I I I I II 

Db 1033 CAGCTGAACAACGTGGGGCTGTCGGCAGTGTGCGCCTACAACCTGTC CACAGCCGAG 1089 

Qy 1143 GAACGT GT CTTTAAGGGGAAAT ACAAAGAGTT GAACAAAG AAACTT CAC GC 1193 



II II I I I II 1 1 1 1 1 1 1 1 I 1 1 1 1 I 

Db 1090 GAG GT C T T CT C CC AC GGGAAGT AC AT GC AGAG CAC CAC AGT GGAGCAGT C CC AC ACCAAG 114 9 

Qy 1194 TGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGC 1250 

Ml I I I I I I I I I I I I I I I I I II I I I I Ml I II 

Db 1150 TGGGTGCGCTATAATGGCCCGGTACCCAAGCCGCGGCCTGGAGCGTGCATCGACAGCGAG 1209 

Qy 1251 CCCTCCTCTGATAAGGCCCTGACCTTCATG 1280 

I I II III I III I I I I 
Db 1210 G CAC G GG C C GC CAACT ACACCAGCT C CT T GAATT T GCC AGACAAGACGCT GCAGT T C GT T 1269 

Qy 1281 AAGGAC CATTT CCT GAT GGAT GA GCAAGTGGTGGGGACGCCCCTGCTGGTG 1331 

I I I M I I I I I I I I I I I I I I I I I I I II II I 

Db 1270 AAAGAC CAC CC TT T GAT GGAT GACT C GGT AAC C C CAAT AGACAAC AGGC C C AGGT TAAT C 1329 

Qy 1332 AAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCAC 1391 

II I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I 

Db 1330 AAGAAAGAT GT GAACTACACC CAGATCGTGGT GGACCGGACCCAGGCC CT GGAT GGGAGT 1389 

Qy 1392 AGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGT 1451 

III I I I I I I I I I III I I I I I I I I I I I I I I I I 

Db 1390 GT CTAT GAT GT CAT GTT T GT C AGC AC AGAC C GGGGAGCT C T GC ACAAAGC C AT C AGC 144 6 

Qy 1452 GGGGACAGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCT GT T C C CT GACCCT GAAC CT GT T 1511 

II I M I I I I I I I I I I I I I I I I I I I I III I I I I I I I 
Db 1447 CT C GAGCACGCTGTT CACATCAT CGAGGAGAC CCAGCT CTTCCAGGACTTT GAGCCAGT C 1506 

Qy 1512 CGCAACCTGCAGCTGGCCCCCACCCAGGGT GCAGT GTTTGT AGGCTTCTCAGGA 1565 

I I I I II I II II I II I I I I I I I II I I I I I 

Db 1507 CAGACCCTGCTGCTGTCTTCAAAGAAGGGCAACAGGTTTGTCTATGCTGGCTCTAACTCG 1566 

Qy 1566 GGT GT CT GGAGGGT GC C C C GAGCCAACT GTAGT GT CTAT GAGAGCT GT GT GGACT GT GT C 1625 

M M M Ml Ml I I I I I II I I II I I I I I I I I I I 

Db 1567 GGCGTGGTCCAGGCCCCGCTGGCCTTCTGTGGGAAGCACGGCACCTGCGAGGACTGTGTG 1626 

Qy 1626 CTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTG 1672 

I I II I I I I I II I I I I II I I I I I I III I I I I I I 

Db 1627 CTGGCGCGGGACCCCTACTGCGCCTGGAGCCCGCCCACAGCGACCTG 1673 



RESULT 3 

US-09-077-940A-3 

Sequence 3, Application US/09077940A 
Patent No. 6576441 
GENERAL INFORMATION: 
APPLICANT: KIMURA, Toru et al . 

TITLE OF INVENTION: NOVEL SEMAPHORIN Z AND GENE ENCODING THE SAME 
FILE REFERENCE: 0020-4426P 

CURRENT APPLICATION NUMBER: US/09/077, 94 OA 
CURRENT FILING DATE: 1998-06-05 
NUMBER OF SEQ ID NOS : 20 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 3 
LENGTH: 3524 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 



NAME /KEY : 5 1 UTR 
LOCATION: (1) . . (38) 
OTHER INFORMATION: 
NAME/KEY: 3 1 UTR 
LOCATION: (2706) . . (3524) 
OTHER INFORMATION: 
NAME/ KEY: CDS 
LOCATION: (39) . . (2702) 
OTHER INFORMATION: 
US-09-077-940A-3 

Query Match 4.0%; Score 126; DB 4; Length 3524; 

Best Local Similarity 55.3%; Pred. No. 2.5e-23; 

Matches 315; Conservative 0; Mismatches 240; Indels 15; Gaps 3 

Qy 450 AAGAAGAAGAGCAAT GAGACACAGT GTTT CAACTT CAT C CGT GT C CT GGTTT CTTACAAT 509 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 390 ATGAAGGGCAAACAGGAGGGCGAGTGTCGAAACTTCGTAAAGGTGCTGCTCCTTCGGGAC 449 

Qy 510 GTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAA 569 

I II MM I II I I II I I I II I I I I I I I II II I 

Db 450 GAGTCCACGCTCTTTGTGTGCGGTTCCAACGCCTTCAACCCGGTGTGCGCCAACTACAGC 509 

Qy 570 CTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAA 62 9 

II I M II I I I I M III III II I Ml 

Db 510 ATAGA CACCCTGCAGCCCGTCGGAGACAA CAT CAGC G GTAT GGC C C GC 557 

Qy 630 AGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCT 68 9 

II I I I II II II III II II I I I I I I I I I II II I I I I 

Db 558 TGCCCGTACGACCCCAAGCACGCCAATGTTGCCCTCTTCTCTGACGGGATGCTCTTCACA 617 

Qy 690 GGT ACT AT GAACAACT T C CT GGGC AGT GAGC CCAT CCT GAT GC GCAC ACT GGGAT C CCAG 74 9 

I I M I I I I I I I I I II I I I I I I I III MM II II I I 

Db 618 GCTACTGTTACCGACTTCCTAGCCATTGATGCTGTCATCTACCGCAGCCTCGGGGACAGG 677 

Qy 750 CCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCA 809 

II III I I I I M I I I I III I I I I I I I I 

Db 678 CCCACCCTGCGCACCGTGAAACATGACTCCAAGTGGTTCAAAGAGCCTTACTTTGTCCAT 737 

Qy 810 GCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGAC 869 

II I II I I M I II II I I I II II I I I I I III I I I I I I I I 

Db 738 GCGGTGGAGTGGGGCAGCCATGTCTACTTCTTCTTCCGGGAGATTGCGATGGAGTTTAAC 797 

Qy 870 TTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGC 929 

I I I I II I I I I I I I I II II I I I I II I I I I I I II I I I I I I I I I 

Db 798 TACCTGGAGAAGGTGGTGGTGTCCCGCGTGGCCCGAGTGTGCAAGAACGACGTGGGAGGC 8 57 

Qy 930 GAAAAGC T GCT GCAGAAGAAGT GGAC CAC CTT CCT GAAGGC CCAGCT GCT CT GCAC C 986 

I I I II I I I I I I II I II M I I I I I I I I I II II I I I I I I I I I 
Db 858 TCCCCCCGCGTGCTGGAGAAGCAGTGGACGTCCTTCCTGAAGGCGCGGCTCAACTGCTCT 917 

Qy 987 CAGCCGGGGCAGCTGCCCTTCAACGTCATC 1016 

I I I I I I I I I I I I I I I 

Db 918 GT AC C C GGAGAC T C C CAT T T CT ACT T CAAC 947 



RESULT 4 



US-09-077-940A-1 

; Sequence 1, Application US/09077940A 

; Patent No. 6576441 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru et al . 

; TITLE OF INVENTION: NOVEL SEMAPHORIN Z AND GENE ENCODING THE SAME 
; FILE REFERENCE: 0020-4426P 

; CURRENT APPLICATION NUMBER: US/09/077, 940A 
; CURRENT FILING DATE: 1998-06-05 
; NUMBER OF SEQ ID NOS : 20 

SOFTWARE: Patentln version 3.1 
; SEQ ID NO 1 

LENGTH: 3692 

TYPE: DNA 
; ORGANISM: Rattus norvegicus 

FEATURE : 

NAME/ KEY: 5 1 UTR 

LOCATION: (1)..(18) 

OTHER INFORMATION: 

NAME/ KEY: CDS 

LOCATION: (19) . . (2682) 

OTHER INFORMATION: 

NAME/ KEY: 3 ? UTR 
; LOCATION: (2683 )..( 3653 ) 
; OTHER INFORMATION: 
; NAME/KEY: polyA_site 

LOCATION: (3654 )..( 3692 ) 
; OTHER INFORMATION: 
US-09-077-940A-1 

Query Match 4.0%; Score 125.4; DB 4; Length 3692; 

Best Local Similarity 58.5%; Pred. No. 3.7e-23; 

Matches 238; Conservative 0; Mismatches 166; Indels 3; Gaps 1 

Qy 611 CATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGT 67 0 

III Ml III I I I I I I I I I I I I II I I II I I I I 

Db 522 CATCAGTGGTATGGCCCGCTGCCCCTACGACCCCAAGCATGCCAATGTCGCCCTCTTCTC 581 

Qy 671 GGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGAT 730 

I M I I I I I I I I I I II II II I I I I I I I I I I II I I I 
Db 582 AGAT GGGAT GCTCTT CACAGC CACAGTAACTGACTT CCTAGCCAT CGAC GCTGTT AT CT A 641 

Qy 731 GCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCA 790 

I I I II I I I I I I I II I I I I I I I I I I I 

Db 642 CCGTAGCCTTGGGGACCGGCCCACACTGCGCACAGTAAAGCATGACTCCAAGTGGTTTAA 7 01 

Qy 791 TGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGA 850 

M I I II I I I I I II I II I I I I I I I I I I I I I I I I III 

Db 7 02 AGAGCCATACTTTGTGCATGCGGTGGAGTGGGGAAGCCACGTCTACTTCTTCTTCCGGGA 7 61 

Qy 851 GACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTG 910 

M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 762 GATCGCCATGGAGTTTAACTATCTGGAAAAGGTGGTGGTGTCCCGTGTGGCCCGTGTATG 821 

Qy 911 C AAGAAT GAC GT G GG C G G C GAAAAGCT GC T G CAGAAGAAGT G GACCAC CT T C CT GAA 967 

M 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I 
Db 822 CAAGAATGATGTGGGCGGCTCCCCACGGGTGCTGGAGAAGCAGTGGACTTCCTTCCTGAA 881 



Qy 968 GGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCA 1014 

I I I II I i I I I I I I I I I I I I I I I I I II I I I I I 

Db 882 GGCCCGGCTCAACTGCTCCGTGCCTGGGGACTCACACTTCTACTTCA 928 



RESULT 5 

US-09-976-594-1002 

; Sequence 1002, Application US/09976594 

; Patent No. 6673549 

; GENERAL INFORMATION: 

; APPLICANT: Furness, Michael 

; APPLICANT: Buchbinder, Jenny 

; TITLE OF INVENTION: GENES EXPRESSED IN C3A LIVER CELL CULTURES TREATED WITH 
STEROIDS 

; FILE REFERENCE: PA- 0041 US 

; CURRENT APPLICATION NUMBER: US/09/976, 594 

; CURRENT FILING DATE: 2001-10-12 

; PRIOR APPLICATION NUMBER: 60/240,409 

; PRIOR FILING DATE: 2000-10-12 

; NUMBER OF SEQ ID NOS : 1143 

; SOFTWARE: PERL Program 

; SEQ ID NO 1002 

LENGTH: 2278 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 
; NAME/ KEY: misc_feature 

OTHER INFORMATION: Incyte ID No. 6673549 411373.7 
US-09-976-594-1002 

Query Match 3.2%; Score 102; DB 4; Length 2278; 

Best Local Similarity 50.0%; Pred. No. 4.9e-17; 

Matches 339; Conservative 0; Mismatches 330; Indels 9; Gaps 3; 
Qy 618 GGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGG 677 

111! I I I MM I Ml II II I I I I I I I II I I I 

Db 761 GGAAT GGCCAGAT GCCCATAT GAT GC CAAACAT GCCAACGTT GCACT GTTTGCAGAT GGA 820 

Qy 678 ATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACA 737 

I I I I 1 I I I II III I I I I I I I I I I I I I I III III 
Db 821 AAACT AT AC T C AGC CAC AGT GACT GACT T C CT T GC CAT T GAC GCAGT C AT TT AC C G GAGT 8 80 

Qy 7 38 CTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCC 7 97 

I I I I I I II I I I I I I I I I I I I I I I I I 

Db 881 CTT GGAGAAAGC C CT AC C CT GC G GAC C GT CAAGC AC GATT C AAAAT G GT T GAAAGAAC C A 94 0 

Qy 798 TCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCC 857 

I I I II I I I I II I II I I I II I I I I I I I I I I I I I I I I I 

Db 941 TACTTTGTTCAAGCCGTGGATTACGGAGATTATATCTACTTCTTCTTCAGGGAAATAGCA 100 0 

Qy 858 AGCGAGTT T GACTT CTTT GAGAGGCT CCACACAT CGCGGGT GGCTAGAGT CT GCAAGAAT 917 

I I I I I I I III III I I I I I I I I I I I I I II I I I 

Db 1001 GT GGAGT ATAACAC CAT GG GAAAGGT AGT T T T C C CAAGAGT G GCT CAGGT TT GT AAGAAT 1060 

Qy 918 GACGTGGGCGG CGAAAAGCTGCT GCAGAAGAAGTGGACCACCTT CCTGAAGGCCCAG 974 

II I I I I I I III I I I I II II I I I I I I I I I I I I I I I I I II I 



Db 



1061 GAT AT GG GAG GAT CT CAAAGAGT C CT GGAGAAAC AGT GGAC GT C GT T C CT GAAG GC G C G C 112 0 



QY 975 CTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTC 1034 

I I I I I I I II I I I I I I I I I I I II II I 

Db 1121 TT GAACTGCT CAGTT C CT GGAGACT CT CATT TTTATTTCAACATTCTCCAGGCAGTTACA 118 0 

Qy 1035 CCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTT 1094 

I I I I I I I I I II Ml I I 

Db 1181 GAT GT GAT T C GT AT CAAC GGG C GT GAT GT TGTCCTGGCAACGTTTTCTACACCTTAT 1237 

Qy 1095 GGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTT 1154 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1238 AACAGCATCCCTGGGTCTGCAGTCTGTGCCTATGACATGCTTGACATTGCCAGTGTTTTT 1297 

Qy 1155 AAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT GGACT AC — - - T T AT AGGGGC 1211 

I I I I I I I I I I II III 1 I I I I I I I I I I I I 

Db 1298 ACT GGGAGATT CAAGGAACAGAAGT CT CCT GAT T C CACC T G GACAC C AGT T C CT GAT GAA 1357 

Qy 1212 CCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTG 1271 

I I I I I I I I I I I I I I I III II I I I I I I III 

Db 1358 CGAGTTCCTAAGCCCAGGCCAGGTTGCTGTGCTGGCTCATCCTCCTTAGAAAGATATGCA 1417 

Qy 1272 ACCTTCATGAAGGACCAT 1289 

I I I I II II III 
Db 1418 ACCTCCAATGAGTTCCCT 1435 



RESULT 6 

US-09-833-381-202 

; Sequence 202, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
; FILE REFERENCE: 5800-119 

; CURRENT APPLICATION NUMBER: US/09/833, 381 

; CURRENT FILING DATE: 2001-04-11 

; PRIOR APPLICATION NUMBER: 09/516,448 

; PRIOR FILING DATE: 2000-02-29 

; NUMBER OF SEQ ID NOS : 2050 

SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 202 

LENGTH: 121 

TYPE: DNA 
; ORGANISM: Homo sapiens 
US-09-833-381-202 



Query Match 3.1%; Score 98.6; DB 4 ; Length 121; 

Best Local Similarity 88.4%; Pred. No. 9e-17; 

Matches 107; Conservative 0; Mismatches 14; Indels 0; Gaps 0; 

Qy 794 CGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGAC 853 

M I I I I II I I I I I I II I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
Db 1 CGCCTCCTTTGTGGAAGACATCCCTTCTACCCACGGCGCCTACTTCTTCTTCCAGGAGAC 60 

Qy 854 AGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAA 913 

I I I I I I I I I I I I MM I I I I II I I M II I II II II II II I I I I I I I I I I I I I I 



Db 



61 AGC C AG C GAGTT AGAC T CT T T T GAGAG GCT C C ACACAT AAT GGT T G GCT AGAGT CT GCAA 120 



Qy 914 G 914 

I 

Db 121 G 121 



RESULT 7 
US-09-254-594-5 

; Sequence 5, Application US/09254594 

; Patent No. 6566094 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru 

; APPLICANT: KIKUCHI, Kaoru 

; TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 

; FILE REFERENCE: 0020-4527P 

; CURRENT APPLICATION NUMBER: US/ 09/254 , 594 

; CURRENT FILING DATE: 1999-05-11 

; NUMBER OF SEQ ID NOS : 13 

; SOFTWARE: Pa tent In version 3.0 

; SEQ ID NO 5 

LENGTH: 2790 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 
; NAME/KEY: misc_f eature 

LOCATION: ()..() 

OTHER INFORMATION: Tissue Type: Child Brain 
NAME/ KEY: CDS 
; LOCATION: (1) . . (2790) 

; OTHER INFORMATION: Identification Method: E 
; NAME/KEY: mis c_f eature 
LOCATION: ()..() 

; OTHER INFORMATION: Identification Method: P for resulting peptide 
US-09-254-594-5 

Query Match 3.1%; Score 98.6; DB 4; Length 2790; 

Best Local Similarity 50.1%; Pred. No. 4.3e-16; 

Matches 369; Conservative 0; Mismatches 344; Indels 24; Gaps 4; 

Qy 472 AGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCG 531 

II 11 I I I I I I I I I I I I I I I I I I I I I I III Mill 

Db 359 AGTGCTACAACTATATTCGTGTTCTTGTTCCCTGGGACTCCCAGACGCTCCTTGCCTGTG 418 

Qy 532 GCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGC 591 

III I I I I I I I I I I I I I I I I II I III 

Db 419 GAACGAACT CATT CAGC CCTGT GT GCCGCAGCTAT GGGAT AACTTCGC 4 66 

Qy 592 C CAT CT C G GAGGACAAG GT CAT GGAGGGAAAAGGC CAAAGCC CCTT T GACC C C GCT CACA 651 

I I I I I III II II II I I I I I I I I I I I I I I I I I 
Db 467 TGCAGCAGGAGGGTGAGGAACTGAGTGGGCAGGCTCGATGCCCCTTTGATGCCACCCAGT 526 

Qy 652 AGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGG 711 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 

Db 527 CCAACGTGGCCATCTTTGCAGAGGGCAGCCTGTACTCAGCCACAGCTGCGGATTTCCAGG 58 6 



Qy 



712 GCAGT GAGC C CAT C CT GAT G C G C AC ACT G GGAT C C CAGC CT GT C CT CAAGAC C GAC AACT 771 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



587 



772 



647 



832 



707 



892 



I I I I I I I I I II III! I I I II I I III I I I I II I 

CCAGTGATGCTGTAGTTTACAGAAGCCTTGGGCCCCAGCCCCCACTCCGCTCCGCCAAGT 

TCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCG 
I I I I I I I I I I I I I I I II I I I I 

AT GACT C CAAGT GG C T C C GAGAGC CACACT T T GT C CAGGC CT T GGAGCAT GGAGACC AT G 

T CT AC TT CTT CT T C GAGGAGAC AGC C AG C GAGT T T GACT T CT TT GAGAGG CT C CAC AC AT 
I I I I I I I II I I I I I III I III II I I II I I II I 

TCTACTTCTTCTTCCGCGAGGTCTCTGTGGAGGATGCTCGGCTGGGGAAGGTGCAGTTCT 



CGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTG CTGCAGAAGA 

I I I I I I I I I II I I I I I I I I I I I I II I I II III 

767 CCCGCGTAGCCCGAGTATGTAAACGTGACATGGGCGGCTCGCCTCGGGCCTTGGACCGCC 



646 



831 



706 



891 



766 



948 



826 



949 AGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCA 1008 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

827 ACTGGACATCCTTCCTGAAGCTTCGGCTCAACTGCTCTGTCCCTGGGGACTCTACTTTCT 88 6 

1009 A CGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCT 1065 

I II I I I I I I I I I I I I II 

8 87 ATTTTGATGTTTTACAGGCCTTGACTGGGCCTGTGAACCTGCATGGCCGCTCTGCTCTCT 946 

1066 ACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCT 1125 
I I I I I I I I I I I I I I I I III II I I I I I I I I I I I II 

947 TTGGGGTCTTCACCACCCAGACCAA TAGCATCCCTGGCTCTGCCGTCTGCGCCT 1000 

112 6 T CT CT CT CTT GGACAT T GAAC GT GT CTT TAAGG GGAAAT ACAAAGAGT T GAACAAAGAAA 1185 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1001 T CTAC CT GGATGAGATT GAGCGTGGGTT T GAGGGCAAGTT CAAGGAGCAGAGGAGT CT GG 1060 

1186 CTTCACGCTGGACTACT 1202 

I I I I I I I I I I 

1061 AT GG GG CCTG GACT CCT 1077 



RESULT 8 
US-09-254-594-4 

; Sequence 4, Application US/09254594 

; Patent No. 6566094 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru 

; APPLICANT: KIKUCHI, Kaoru 

; TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 

; FILE REFERENCE: 0020-4527P 

; CURRENT APPLICATION NUMBER: US/09/254,594 

; CURRENT FILING DATE: 1999-05-11 

; NUMBER OF SEQ ID NOS : 13 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 4 

; LENGTH: 3432 

; TYPE: DNA 

; ORGANISM: Homo sapiens 

FEATURE : 
; NAME/KEY: misc_feature 

LOCATION: ()..() 

OTHER INFORMATION: Tissue Type: Child Brain 



NAME/ KEY: 5 r UTR 
LOCATION: (1) . . (187) 

OTHER INFORMATION: Identification Method: E 
; NAME /KEY: mis cofeature 
; LOCATION: (188) . . (2977) 

OTHER INFORMATION: CDS; Identification Method: E 

NAME/ KEY: 3 'UTR 
; LOCATION: (2978 ) . . ( 34 07 ) 

; OTHER INFORMATION: Identification Method: E 

NAME/KEY: polyAjsignal 

LOCATION: ( 34 08 ) . . ( 3432 ) 
; OTHER INFORMATION: Identification Method: E 
US-09-254-594-4 

Query Match 3.1%; Score 98.6; DB 4; Length 3432; 

Best Local Similarity 50.1%; Pred. No. 4.8e-16; 

Matches 369; Conservative 0; Mismatches 344; Indels 24; Gaps 4; 

Qy 472 AGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCG 531 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 54 6 AGTGCTACAACTATATTCGTGTTCTTGTTCCCTGGGACTCCCAGACGCTCCTTGCCTGTG 605 

Qy 532 GCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGC 591 

III I I I I I I I I I I I I I I I I II I I I I 

Db 606 GAAC GAAC T CAT T CAGC C CT GT GT GCC GCAGCT AT GGGAT AACTTCGC 653 

Qy 592 C CAT CT CGGAGGACAAGGT CAT GGAGGGAAAAGGC CAAAGC C C CTTT GAC CCCGCTCACA 651 

I I I I I I I I II II II I I I I I I I I I I I I I I I I I 
Db 654 TGCAGCAGGAGGGTGAGGAACTGAGTGGGCAGGCTCGATGCCCCTTTGATGCCACCCAGT 713 

Qy 652 AGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGG 711 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I 

Db 714 C CAAC GT GGC CATCTT T G CAGAGGGCAGC CT GT ACT CAGC CACAG CT G C G GATT T C CAGG 773 

Qy 712 GCAGT GAGCCCAT CCT GAT GCGCACACT GGGAT CCCAGCCT GT CCT CAAGAC CGACAACT 771 

I 1 I I I I I I I II I I I I I II I I I I III I I I I I I I 

Db 774 C CAGT GAT GCT GTAGT T T ACAGAAGC CT T GGGC C C CAGC C C C C ACT C CGCTCCGC CAAGT 833 

Qy 772 TCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCG 831 

I I I I I I I I I I I I I I I I I I I I I 

Db 834 ATGACTCCAAGTGGCTCCGAGAGCCACACTTTGTCCAGGCCTTGGAGCATGGAGACCATG 893 

Qy 832 T CT ACT T C TT CT T C GAG GAGAC AGC C AGC GAGT T T GACT T CTT T GAGAGGC T C C AC AC AT 891 

I I I I I II I I I I I I I III I Ml I I I I I I I I I I I 

Db 894 TCTACTTCTTCTTCCGCGAGGTCTCTGTGGAGGATGCTCGGCTGGGGAAGGTGCAGTTCT 953 

Qy 892 CGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTG CTGCAGAAGA 94 8 

I I I I I I I I I I I I I II I I I I I I I I I I I I II Ml 

Db 954 CCCGCGTAGCCCGAGTATGTAAACGTGACATGGGCGGCTCGCCTCGGGCCTTGGACCGCC 1013 

Qy 949 AGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCA 1008 

I I I I I I I I I I I I I I I I I I Ml I I II I I I II I I I I II 

Db 1014 ACTGGACATCCTTCCTGAAGCTTCGGCTCAACTGCTCTGTCCCTGGGGACTCTACTTTCT 1073 

Qy 1009 A CGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCT 1065 

I II M II I II I I I I III 

Db 1074 ATTTTGATGTTTTACAGGCCTTGACTGGGCCTGTGAACCTGCATGGCCGCTCTGCTCTCT 1133 



Qy 



1066 ACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCT 1125 



Db 



1134 TTGGGGTCTT C AC C AC C C AG AC C AA TAGCATCCCTGGCTCTGCCGTCTGCGCCT 1187 



Qy 



1126 T C T CT CT CTT GGAC AT T GAAC GT GT C T T TAAGG GGAAAT ACAAAGAGT T GAAC AAAGAAA 1185 

III II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I 

1188 T CTACCT GGAT GAGATTGAGCGT GGGTTT GAGGGCAAGTT CAAGGAGCAGAGGAGT CT GG 1247 



Db 



Qy 



118 6 CTTCACGCTGGACTACT 1202 



Db 



1248 ATGGGGCCTGGACTCCT 1264 



RESULT 9 
US-09-254-594-2 

; Sequence 2, Application US/09254594 

; Patent No. 6566094 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru 

; APPLICANT: KIKUCHI, Kaoru 

; TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 

; FILE REFERENCE: 0020-4527P 

; CURRENT APPLICATION NUMBER: US/ 09/254 , 594 

; CURRENT FILING DATE: 1999-05-11 

; NUMBER OF SEQ ID NOS : 13 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 2 

LENGTH: 27 87 

TYPE: DNA 
; ORGANISM: Rattus norvegicus 

FEATURE : 
; NAME/ KEY: misc_feature 

LOCATION: ()..() 
; OTHER INFORMATION: Tissue Type: Brain 

NAME/ KEY: CDS 

LOCATION: (1) . . (2787) 
; OTHER INFORMATION: Identification Method: E 

NAME/KEY: misc_feature 

LOCATION: ()..() 

; OTHER INFORMATION: Identification Method: P for resulting peptide 
US-09-254-594-2 

Query Match 2.9%; Score 89.8; DB 4; Length 2787; 

Best Local Similarity 50.1%; Pred. No. 9.5e-14; 

Matches 369; Conservative 0; Mismatches 347; Indels 21; Gaps 5; 

Qy 472 AGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCG 531 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 356 AATGCTACAACTACATCCGTGTTCTTGTTCCCTGGGACTCGCAGACACTCCTTGCCTGTG 415 

Qy 532 GCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGC 591 

III I I I I I I I I II I I III I I II I I I II 

Db 416 GAACAAAT TCCTT CAGCCCT GTGT GT CGCAGCTAT GGGATAACAT CT CT GCAAC 469 



Qy 



592 CC AT CT C G GAGGACAAGGT CAT GGAG G GAAAAG G C CAAAG C C C CT TT GAC C C C G CT CACA 651 
I I I I I III II I I III I I I I I I I I I I I I I I I I I 



Db 



470 AGGAGGGTGAGGAGCTGAGTGGGCAAGCTCGATGCCCCTTTGATGCCACCCAGT 523 



Qy 652 AGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGG 711 

I I I I III I I I I I I I I I I I I II I I I I I M 

Db 524 C C AC T GT G GC C AT CT CT GC AGAGGGT AGTT T GTACT C AG C C AC AG CAGC AGAT T T C C AG G 583 

QY 712 GCAGT GAG C C CAT C CT GAT GC GCAC ACT GGGAT CC CAGC CT GT C C T CAAGAC C GACAAC T 771 

I I I I I I I I I II I I I II I I I I I I III || Ml 

Db 584 CCAGTGATGCTGTGGTTTACAGAAGCCTTGGACCTCAGCCCCCACTCCGTTCTGCA7VAGT 643 

Qy 772 TCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCAT CCCTTCGACCCAGG 828 

I I I I I I I I I I II I I I I II I II I | I | 

Db 644 AT GACT C CAAGT GGCTT C GAGAG C C AC ACT TT GT CT AT GCTT T GGAGC AT G GAGAC CAT G 703 

Qy 82 9 T C GT C TACT TCTTCTTC G AGGAGACAGC C AG C GAGT T T GACT T CT T T GAGAGGC T C C ACA 888 

I I I I I I I I I I I I I I I I I I I I I I II I M 

Db 704 TCTACTTCTTTCTTCCGGAGAAGTCTCTGTGGAGGACGCCCGGCCTGGGGAGGGTGCAGT 763 

Qy 889 CATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTG CTGCAGA 945 

M II I I II I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 764 TTTCCCGGGTGGCCCGGGTGTGTAAACGTGACATGGGTGGCTCACCACGGGCCTTGGATC 823 

Qy 94 6 AGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCT 1005 

I I I I M I I I I I I I I I I II I I I I I I I I I I I I I | M 

Db 824 GCCACTGGACATCCTTCCTTAAGCTGAGGCTCAACTGCTCCGTCCCTGGGGACTCTACCT 883 

Qy 1006 TCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCT 1065 

I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 884 TCTAC-TTTGATGTCTTACAGTCCTTAACTGGGCCTGTGAACCTGCATGGGCGCTCTGC- 941 

Qy 1066 ACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCT 1125 

I I Ml Ml II I I I I I I I I I I I I I I 

Db 942 -CCTCTTTGGGGTCTTCACTACTCAGACCAATAGCATTCCTGGGTCTGCAGTCTGCGCCT 1000 

Qy 1126 TCTCTCTCT T GGAC AT T GAAC GT GT CTT T AAGGGGAAAT ACAAAGAGT T GAAC AAAGAAA 1185 

I I I M I I I I I I I I I I I I i I I I I I I I I I I I I I I I I | || | 

Db 1001 T CTACCTAGAT GACATT GAACGT GGCTT T GAGGGCAAGTT CAAGGAGCAGAGGAGT CTGG 1060 

Qy 1186 CTTCACGCTGGACTACT 1202 

I I I I I I I I I I 

Db 1061 ATGGGGCCTGGACTCCT 1077 



RESULT 10 
US-09-254-594-1 

; Sequence 1, Application US/09254594 

; Patent No. 6566094 

; GENERAL INFORMATION: 

; APPLICANT: KIMURA, Toru 

; APPLICANT: KIKUCHI, Kaoru 

; TITLE OF INVENTION: NOVEL SEMAPHORIN GENE: SEMAPHORIN Y 

; FILE REFERENCE: 0020-4527P 

; CURRENT APPLICATION NUMBER: US/09/254,594 

; CURRENT FILING DATE: 1999-05-11 

; NUMBER OF SEQ ID NOS : 13 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 1 



LENGTH: 3195 
TYPE : DNA 
; ORGANISM: Rattus norvegicus 
FEATURE : 

NAME/ KEY : misc_f eature 

LOCATION: ()..() 
; OTHER INFORMATION: Tissue Type: Brain 

NAME/ KEY: 5'UTR 
; LOCATION: (1) . . (50) 

OTHER INFORMATION: Identification Method: E 

NAME/KEY: misc__f eature 

LOCATION: (51).. (2837) 

OTHER INFORMATION: CDS; Identification Method: E 

NAME/KEY: 3 1 UTR 

LOCATION: (2838 )..( 3195 ) 
; OTHER INFORMATION: Identification Method: E 
US-09-254-594-1 

Query Match 2.9%; Score 89.8; DB 4 ; Length 3195; 

Best Local Similarity 50.1%; Pred. No. le-13; 

Matches 369; Conservative 0; Mismatches 347; Indels 21; Gaps 5; 

Qy 472 AGT GT T T CAACT T CAT C C GT GT C CT GGT T T CT T ACAAT GT CAC C CAT CT CT ACAC CT G C G 531 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 4 06 AATGCTACAACTACATCCGTGTTCTTGTTCCCTGGGACTCGCAGACACTCCTTGCCTGTG 465 

Qy 532 GCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGC 591 

I II I I I I I I! I I I I I III I I I I I I I II 

Db 4 66 GAACAAATT CCTT CAGCC CT GT GT GT CGCAGCTAT GGGATAACAT CT CT GCAAC 519 

Qy 592 CCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACA 651 

I 1 I I I III II II III I I I I I I 1 I I I I I I I I I I 
Db 520 AGGAGGGTGAGGAGCT GAGT GGGCAAGCTCGAT GCCCCTTT GAT GCCACCCAGT 573 

Qy 652 AGCAT AC GGCT GT CT T GGT GGAT GGGAT GCT CTATT CT GGT ACTAT GAACAACT T CCT GG 711 

I III III I I I I I I I I I I I I II I I I I I I I 

Db 574 C CACT GT GGC C AT CT CT GC AGAG GGT AGT T T GTACT CAGC C AC AGC AGCAGAT TT C C AG G 633 

Qy 712 GCAGT GAGCC CAT C CT GAT GCGCACACT GGGAT CCCAGC CT GT CCT CAAGACC GACAACT 771 

I I I I I I I I I II I I I I I I I I I I I Ml I I III 

Db 634 C CAGT GAT GCT GT GGTT T ACAGAAG C CT T GGACCT CAGC C CC CACT C C GTT CT GCAAAGT 693 

Qy 772 TCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCAT CCCTTCGACCCAGG 828 

I I I I I I I I I I I I I I I I III II II! I 

Db 694 AT GACT C CAAGT GGCT T C GAGAG C C ACACT TT GT CTAT GCT TT GGAGC AT GGAGACCAT G 753 

Qy 82 9 T C GT CT ACT TCTTCTTC GAGGAGAC AGC C AG C GAGT T T GACT T C TT T GAGAG GCT C CAC A 8 88 

II Mill I I I I II I I I I I I I MM I II 

Db 754 TCTACTTCTTTCTTCCGGAGAAGTCTCTGTGGAGGACGCCCGGCCTGGGGAGGGT GCAGT 813 

Qy 88 9 CAT C G CG GGT GGCTAGAGT CT GCAAGAAT GAC GT GGGC GGC GAAAAG CT G CTGCAGA 94 5 

II I I I I I I II I I I I I I I I II I I II I II I I II II I 

Db 814 TTTCCCGGGTGGCCCGGGTGTGTAAACGTGACATGGGTGGCTCACCACGGGCCTTGGATC 87 3 

Qy 94 6 AGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCT 1005 

I I I I II I I I M I I I I I III MUM II Ml I III 

Db 874 GCCACTGGACATCCTTCCTTAAGCTGAGGCTCAACTGCTCCGTCCCTGGGGACTCTACCT 933 



Qy 1006 TCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCT 1065 

I I I I I II I I I I I I I III I I I I I I I I I 

Db 934 TCTAC-TTTGATGTCTTACAGTCCTTAACTGGGCCTGTGAACCTGCATGGGCGCTCTGC- 991 

Qy 1066 ACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCT 1125 

I I Ml Ml II I I I I I I I I I I I I ! I 

Db 992 -CCTCTTTGGGGTCTTCACTACTCAGACCAATAGCATTCCTGGGTCTGCAGTCTGCGCCT 1050 

Qy 1126 T CT CT CT CT T GGACATT GAAC GT GT C TT T AAGGGGAAATACAAAGAGT T GAACAAAGAAA 1185 

Ml M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I 

Db 1051 T CTAC CT AGAT GACAT T GAAC GTGGCTTT GAGGGCAAGT T CAAG GAG CAGAGGAGT CT G G 1110 

Qy 118 6 CTTCACGCTGGACTACT 1202 

I I I I I I I I I I 

Db 1111 ATGGGGCCTGGACTCCT 1127 



RESULT 11 
US-09-976-594-632 

; Sequence 632, Application US/09976594 

; Patent No. 6673549 

; GENERAL INFORMATION: 

; APPLICANT: Furness, Michael 

; APPLICANT: Buchbinder, Jenny 

; TITLE OF INVENTION: GENES EXPRESSED IN C3A LIVER CELL CULTURES TREATED WITH 
STEROIDS 

; FILE REFERENCE: PA-0041 US 

; CURRENT APPLICATION NUMBER: US/09/ 97 6 , 594 

; CURRENT FILING DATE: 2001-10-12 

; PRIOR APPLICATION NUMBER: 60/240,409 

; PRIOR FILING DATE: 2000-10-12 

; NUMBER OF SEQ ID NOS : 1143 

; SOFTWARE: PERL Program 

; SEQ ID NO 632 

LENGTH: 4286 
; TYPE : DNA 
; ORGANISM: Homo sapiens 
; FEATURE : 

; NAME/KEY: misc_feature 

OTHER INFORMATION: Incyte ID No. 6673549 238322.6 
US-09-976-594-632 

Query Match 2.7%; Score 84.2; DB 4; Length 42 86; 

Best Local Similarity 50.3%; Pred. No. 3.6e-12; 

Matches 273; Conservative 0; Mismatches 253; Indels 17; Gaps 2; 

Qy 472 AGT GTTT CAACTT CAT CC GT GT C CT GGTTT CTTACAAT GT CAC CCAT CT CTACACCTGC G 531 

I I 1 I I I I I II I I I I I I I I I I I I I I I I II I Mill 

Db 611 AGTGCTACAACTATATTCGTGTTCTTGTTCCCTGGGACTCCCAGACGCTCCTTGCCTGTG 670 

Qy 532 GCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGC 591 

III I I I I II I I I I I I I I I I I I I I II 

Db 671 GAACGAACTCATTCAGCCCTGTGTGCCGCAGCTATGGGAT AACTTCGC 718 



Qy 592 C C AT CT C GGAGGACAAGGT CAT G GAGGGAAAAGGC CAAAGC C C CT T T GACC CC GC T CAC A 651 

Mill II I II II I I I I I I I I I I II II I I I I I 



Db 



719 T GCAG C AG GAGGGT GAGGAACTGAGT G GGC AG G CT C GAT G C C C CT TT GAT G C CAC C C AGT 778 



Qy 652 AGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGG 711 

I III I I I I I I I I I I II II II I II I I I II I I 

Db 779 CCAACGTGGCCATCTTTGCAGAGGGCAGCCTGTACTCAGCCACAGCTGCGGATTTCCAGG 838 

Qy 712 GCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACT 771 

I I I I I I I I I II I I I I I I I I I I I III I I I I I I I 

Db 839 CCAGTGATGCTGTAGTTTACAGAAGCCTTGGGCCCCAGCCCCCACTCCGCTCCGCCAAGT 8 98 

Qy 772 TCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCG 831 

I I I I I I I I I I I I I I I I II I I I 

Db 899 AT GACT C CAAGT GG CT C C GAGAG C C AC ACTTT GT CCAGGC CT T GGAGC AT G GAGAC CAT G 958 

Qy 832 T CT ACT TCTTCTTC GAG GAGAC AGC C AGC GAGTT T GACT T CT T T GAGAG GCT C CAC AC AT 891 

I I I I I I II I I 1! I I III I III II I I I I I I I I I I 

Db 959 TCTACTTCTTCTTCCGCGAGGTCTCTGTGGAGGATGCTCGGCTGGGGAGGGTGCAGTTCT 1018 

Qy 892 CGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGA 94 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1019 CCCGCGTAGCCCGAGTATGTAAACGTGACATGGGCGGCTCGCCTTCGGGTCTTGGTACCG 1078 

Qy 94 9 — AGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTT 1006 

I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I III 

Db 107 9 CCACTGGACATCCTTCCTGAAGCTTCGGCTCAACTGCTCTGTCCCTGGGGACTCTACTTT 1138 

Qy 1007 CAA 1009 

I I 

Db 1139 CTA 1141 



RESULT 12 
US-08-121-713D-59 

Sequence 59, Application US/08121713D 
Patent No. 5639856 
GENERAL INFORMATION: 

APPLICANT: Goodman, Corey S. 
APPLICANT: Kolodkin, Alex L. 
APPLICANT: Matthes, David 
APPLICANT: Bentley, David R. 
APPLICANT: O'Connor, Timothy 

TITLE OF INVENTION: The Semaphorin Gene Family 
NUMBER OF SEQUENCES: 100 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 Bush Street, Suite 3200 
CITY: San Francisco 
STATE : CA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/121, 713D 



FILING DATE: 13-SEP-1993 
; CLASSIFICATION: 514 

ATTORNEY/AGENT INFORMATION: 
; NAME: Osman, Richard A. 

REGISTRATION NUMBER : 36,627 

REFERENCE/ DOCKET NUMBER: B94-002-1 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (415)343-4341 

TELEFAX: (415) 343-4342 

TELEX: 

; INFORMATION FOR SEQ ID NO: 59: 
; SEQUENCE CHARACTERISTICS: 
; LENGTH: 3560 base pairs 

; TYPE: nucleic acid 

; STRANDEDNESS: double 

; TOPOLOGY: linear 

MOLECULE TYPE: cDNA 
; FEATURE : 

NAME/ KEY: CDS 
; LOCATION: 1..1953 

US-08-121-713D-59 

Query Match 2.5%; Score 78.6; DB 1; Length 3560; 

Best Local Similarity 49.2%; Pred. No. le-10; 

Matches 358; Conservative 0; Mismatches 324; Indels 45; Gaps 4; 

Qy 612 ATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTG 671 

I I I I I I I I Mill! I I I I MINI II I I I I Ml 

Db 139 AAGAACGGACAGGCGGTGTGCCCCTACGATCCACGTCACAACTCCACCTCTGTGCTGGCC 198 

Qy 672 GAT GG GAT GCT C T ATT CT G GT ACT AT GAACAACT T C CT GGGCAGT GAGC C CAT C CT GAT G 731 

II II I M M II II I II I I II I M I I I I M II I 

Db 199 GACAAC GAACT GT AT T C CG GT AC C GT GGC GGAT TT CAGT GGCAGCGAT C C GAT TAT C 2 55 

Qy 732 C GC ACACT GGGAT C C CAGCCT GT C CT CAAGAC C GACAAC TTCCTCCGCTGGCT GC AT CAT 791 

I I I I I I I M I II I I I I I II I I 

Db 256 T AC C GGGAGC C C CT GCAGAC C GAGCAGT AC GAT AG C CT AAGT CT C AAC 303 

Qy 792 GACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAG 8 51 

I I I II I II I I I I I II I M II I I I I I II II III 

Db 304 GCACCGAACTTTGTGAGCTCATTTACGCAGGGCGACTTTGTCTATTTCTTCTTTCGGGAA 3 63 

Qy 852 ACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGC 911 

Mill M II I I I MM II I I I I I II I I I I I II I I 

Db 364 ACCGCCGTTGAGTTTATCAACTGTGGCAAGGCGATTTATTCGCGCGTTGCCCGCGTCTGC 423 

Qy 912 AAGAAT GAC GT G GGC GGC GAAAAGCT GCT G CAGAAGAAGT GGAC CAC CTT C CT GAAGGC C 971 

II III I I I I I I I II II I I M I II I I I I I I I I I I 

Db 424 AAATGGGACAAAGGTGGCCCGCATCGATTCCGCAACCGCTGGACATCCTTCCTCAAGTCC 4 83 

Qy 972 CAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCA TC 1016 

III II II II I I II I II II I I I I I I 

Db 4 84 CGCCTCAACTGCTCCATTCCCGGCGATTATCCTTTCTACTTTAATGAAATCCAATCTGCC 543 

Qy 1017 CGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTC 1076 

III III I I I II I I I I I I II M I I I I M I 

Db 544 AGCAAT CT GGT GGAGGGAC AGT AT G G CT C GAT GAGCT C GAAACT GAT CT AC GGAGT CT T C 603 



Qy 1077 ACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTG 1136 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 604 AAC AC GC C GAG C AA CTCAATTCCCGGCTCAGCGGTTTGTGCCTTTGCCCTCCAG 657 

Qy 1137 GAC AT T GAAC GT GT CT TTAAGGG GAAAT ACAAAGAGTT GAACAAAGAAACT T C AC GCT G- 1195 

I I I I I I I I I I I I I I I I I I i I I I I || | | | M I 

Db 658 GACATT GC C GAT AC GT T T GAGGGT C AGT T C AAG GAGCAGACT GGCAT CAACT C CAAC T GG 717 

Qy 1196 GACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTG 1247 

Ml I I I I I I I I Mllll I | 

Db 718 CTGCCAGTGAACAACGCCAAGGTACCCGATCCTCGACCCGGTTCCTGTCACAACGATTCG 777 

Qy 124 8 GGCCCCTCCTCT GAT AAGGC C CT GAC CT T CAT GAAGGAC CAT T T CCT GAT G GAT GAGCAA 1307 

I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 778 AGAGC GCT T C C GGAT C C CACACT GAACT T CAT CAAAACAC AT T C GCTAAT GGAC GAGAAT 837 

Qy 1308 GTGGTGG 1314 

III II 

Db 838 GTGCCGG 84 4 



RESULT 13 
US-08-835-268-59 

Sequence 59, Application US/08835268 
Patent No. 5807826 
GENERAL INFORMATION: 

APPLICANT: Goodman, Corey S. 
APPLICANT: Kolodkin, Alex L. 
APPLICANT: Matthes, David 
APPLICANT: Bentley, David R. 
APPLICANT: O f Connor, Timothy 

TITLE OF INVENTION: The Semaphorin Gene Family 
NUMBER OF SEQUENCES: 100 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 Bush Street, Suite 3200 
CITY: San Francisco 
STATE: CA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/835,268 
FILING DATE: 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/ 08 / 12 1 , 7 13 
FILING DATE: 13-SEP-1993 
ATTORNEY/AGENT INFORMATION: 
NAME: Osman, Richard A. 
REGISTRATION NUMBER: 36,627 
REFERENCE/DOCKET NUMBER: B94-002-1 



TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415)343-4341 
; TELEFAX: (415) 343-4342 

TELEX: 

; INFORMATION FOR SEQ ID NO: 59: 
; SEQUENCE CHARACTERISTICS: 

; LENGTH: 3560 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE : 

NAME/ KEY: CDS 

LOCATION: 1..1953 
US-08-835-268-59 

Query Match 2.5%; Score 78.6; DB 1; Length 3560; 

Best Local Similarity 49.2%; Pred. No. le-10; 

Matches 358; Conservative 0; Mismatches 324; Indels 45; Gaps 4; 

Qy 612 ATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTG 671 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 139 AAGAACGGACAGGCGGTGTGCCCCTACGATCCACGTCACAACTCCACCTCTGTGCTGGCC 198 

Qy 672 GAT GGGAT GCT CT AT T C T G GT ACT AT GAACAACTT C CTG GG CAGT GAGC C CAT C CT GAT G 731 

II I I I I I I I I I I I I II I I I I I I I II I I I I I I I 

Db 199 GACAAC GAACT GT AT T C CGGT AC C GT G GC GGATT T CAGT GGCAGC GAT C C GATT AT C 255 

Qy 732 CGCACACTGGGATCCCAGCCTGTCCTC7WVGACCGACAACTTCCTCCGCTGGCTGCATCAT 791 

I II I I I I I I I I I I I I I I II I I 

Db 256 T AC CGGGAGCCCCT GCAGACCGAGCAGT AC GATAGCCTAAGT CT CAAC 303 

Qy 7 92 GACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAG 851 

I I I I I I I I I I I I I II I I I I I I I I I II I I I III 

Db 304 GCACCGAACTTTGTGAGCTCATTTACGCAGGGCGACTTTGTCTATTTCTTCTTTCGGGAA 363 

Qy 852 ACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGC 911 

I I I I I II I I II I I I I I II I I I I I I I I I I I I II I I 

Db 364 ACCGCCGTTGAGTTTATCAACTGTGGCAAGGCGATTTATTCGCGCGTTGCCCGCGTCTGC 423 

Qy 912 AAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCC 971 

II III I I I I I II II II I I I I I I I I I I I I I I I I I 

Db 424 AAATGGGACAAAGGTGGCCCGCATCGATTCCGCAACCGCTGGACATCCTTCCTCAAGTCC 4 83 

Qy 972 CAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCA TC 1016 

III I I I I I I I I I I I I I I II I I I I I 

Db 484 CGCCTCAACTGCTCCATTCCCGGCGATTATCCTTTCTACTTTAATGAAATCCAATCTGCC 543 

Qy 1017 CGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTC 1076 

III III I I I II I I I I I I I I I I I I M I I I 

Db 544 AG CAAT CT GGT GGAGGGAC AGT AT G G CT C GAT GAGCT C GAAACT GAT C T AC GGAGT CT T C 603 

Qy 1077 ACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTG 1136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 604 AACAC GC C GAGCAA CTCAATTCCCGGCTCAGCGGTTTGTGCCTTTGCCCTCCAG 657 



Qy 1137 GACATT GAAC GT GT CTT T AAGGG GAAAT ACAAAGAGT T GAACAAAGAAACT T CACGCT G - 1195 



Db 658 GAC AT T G C C GAT AC GTT TGAGGGT CAGT T CAAG GAGCAGACT GGCAT CAACT C C AACT G G 717 

Qy 1196 GACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTG 124 7 

III I I I I I I I I I I I I I I I I 

Db 718 CTGCCAGTGAACAACGCCAAGGTACCCGATCCTCGACCCGGTTCCTGTCACAACGATTCG 777 

Qy 1248 GGCCCCTCCTCT GAT AAGG C C CT GAC CT T CAT GAAGGAC CAT T T C C T GAT GGAT GAG C AA 1307 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 778 AGAGCGCTT CCGGAT CC CACACT GAACTT CAT CAAAACACATTCGCTAAT GGAC GAGAAT 8 37 

Qy 1308 GTGGTGG 1314 

III II 

Db 838 GTGCCGG 844 



RESULT 14 
US-09-060-692-59 

Sequence 59, Application US/09060692 
Patent No. 5935865 
GENERAL INFORMATION: 

APPLICANT: Goodman, Corey S. 
APPLICANT: Kolodkin, Alex L. 
APPLICANT: Matthes, David 
APPLICANT: Bentley, David R. 
APPLICANT: O'Connor, Timothy 

TITLE OF INVENTION: The Semaphorin Gene Family 
NUMBER OF SEQUENCES: 100 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 Bush Street, Suite 3200 
CITY: San Francisco 
STATE: CA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/060,692 
FILING DATE: 
CLASSIFICATION: 514 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/08/121,713 
FILING DATE: 13-SEP-1993 
ATTORNEY/AGENT INFORMATION: 
NAME: Osman, Richard A. 
REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: B94-002-1 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: ( 4 15 ) 343-434 1 
TELEFAX: (415) 343-4342 
TELEX: 

INFORMATION FOR SEQ ID NO: 59: 
SEQUENCE CHARACTERISTICS: 



LENGTH: 3560 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE : 

NAME /KEY: CDS 
LOCATION: 1..1953 
US-09-060-692-59 

Query Match 2.5%; Score 78.6; DB 2; Length 3560; 

Best Local Similarity 49.2%; Pred. No. le-10; 

Matches 358; Conservative 0; Mismatches 324; Indels 45; Gaps 4; 

Qy 612 ATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTG 671 

I I I I ! I I I MINI I I I I I I I I I I II I I I I IN 

Db 139 AAGAACGGACAGGCGGTGTGCCCCTACGATCCACGTCACAACTCCACCTCTGTGCTGGCC 198 

Qy 672 GAT GGGAT GCT CTATT CT GGTACT AT GAACAACTTC CTGGGCAGT GAGCCCATCCT GAT G 731 

II II II I I I Mill II I Ml I II I I I I I I II I 

Db 199 GACAAC GAACT GTAT T C C GGT AC C GT G GC GGAT T T CAGT GGC AGC GAT C C GAT TAT C 255 

Qy 732 C GCAC ACT GGGAT CC CAGC CT GT C C T CAAGAC C GACAACT T C CT CC GCT GGCT GC AT CAT 791 

Mil I II I I I M I I I I I II I I 

Db 256 T AC C G GGAGC C C CT G C AGAC CGAGCAGT AC GAT AGC CT AAGT CT CAAC 303 

Qy 7 92 GACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAG 851 

I I I I II II I I I I I II I I II II I I II M I I II I 

Db 304 GCACCGAACTTTGTGAGCTCATTTACGCAGGGCGACTTTGTCTATTTCTTCTTTCGGGAA 363 

Qy 852 ACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGC 911 

Mill I II I I I I I I II II I M I I II I I I II II I I 

Db 364 ACCGCCGTTGAGTTTATCAACTGTGGCAAGGCGATTTATTCGCGCGTTGCCCGCGTCTGC 423 

Qy 912 AAGAAT GAC GT GGGC GGCGAAAAGCT GCT GCAGAAGAAGT GGAC CAC CTT CCT GAAG GC C 971 

II III I I I II II II II I II I I II I I I II II I I I 

Db 424 AAATGGGACAAAGGTGGCCCGCATCGATTCCGCAACCGCTGGACATCCTTCCTCAAGTCC 483 

Qy 972 CAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCA TC 1016 

III I I II I I I I I I I M Ml II I I I 

Db 484 CGCCTCAACTGCTCCATTCCCGGCGATTATCCTTTCTACTTTAATGAAATCCAATCTGCC 54 3 

Qy 1017 CGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTC 1076 

M I I M I I I II I I I I II I II I I II II I I 

Db 544 AGCAAT CT GGT GGAGGGAC AGT AT G G CT C GAT GAGCT C GAAACT GAT CT AC GGAGT CTT C 603 

Qy 1077 ACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTG 1136 

I I I I I I I I I II II I I I II II II I II I I I II I I 

Db 604 AACACGCCGAGCAA CTCAATTCCCGGCTCAGCGGTTTGTGCCTTTGCCCTCCAG 657 

Qy 1137 GACAT T GAACGT GT CTT TAAGGG GAAAT ACAAAGAGTT GAAC AAAGAAACT T CAC GCT G- 1195 

II I I I II I I II II II I I II I II I II I II III 

Db 658 GACAT T GC C GAT AC GT T T GAGGGT CAGT T C AAGGAG CAGAC T GGCAT C AACT C CAACT G G 717 

Qy 1196 GACTACT TATAGGGGCCCTGAGAC CAACCC CC GGCCAGGCAGTTGCT CAGT G 12 47 

Ml I II I I II I I I I I I I I I 

Db 718 CT G C CAGT GAACAAC GC CAAGGT AC C C GAT C CT C GAC C C GGT T C CT GT C ACAAC GAT T C G 777 



Qy 1248 GGCC CCT CCT CT GATAAGGCC CT GACCTT CAT GAAGGACCATTT CCTGAT GGAT GAGCAA 1307 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 778 AGAGCGCTT CCGGAT CCCACACT GAACTT CAT CAAAACACATTC GCTAAT GGACGAGAAT 837 

Qy 1308 GTGGTGG 1314 

III II 

Db 838 GTGCCGG 844 



RESULT 15 
US-08-833-391-59 

Sequence 59, Application US/08833391 
Patent No. 6013781 
GENERAL INFORMATION: 

APPLICANT: Goodman, Corey S. 
APPLICANT: Kolodkin, Alex L. 
APPLICANT: Matthes, David 
APPLICANT: Bentley, David R. 
APPLICANT: O'Connor, Timothy 

TITLE OF INVENTION: The Semaphorin Gene Family 
NUMBER OF SEQUENCES: 100 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 Bush Street, Suite 3200 
CITY: San Francisco 
STATE: CA 
COUNTRY: USA 
ZIP: 94104 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/833,391 
FILING DATE: 
CLASSIFICATION: 530 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/121,713 
FILING DATE: 13-SEP-1993 
ATTORNEY/AGENT INFORMATION: 
NAME: Osman, Richard A. 
REGISTRATION NUMBER: 36,627 
REFERENCE/ DOCKET NUMBER: B94-002-1 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: ( 4 15 ) 343-434 1 
TELEFAX: (415) 343-4342 
TELEX: 

INFORMATION FOR SEQ ID NO: 59: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 3560 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE: 



NAME/ KEY: CDS 
LOCATION: 1..1953 
US-08-833-391-59 

Query Match 2.5%; Score 78.6; DB 3; Length 3560; 

Best Local Similarity 49.2%; Pred. No. le-10; 

Matches 358; Conservative 0; Mismatches 324; Indels 45; Gaps 4; 

QY 612 AT GGAGG GAAAAGG C C AAAG C C C CT T T GAC C C C GC T CAC AAGCATAC G GCT GT CT T G GT G 671 

I I I I I I I I I I I I I I I I I I I I I I I I || I I I I IN 

Db 139 AAGAACGGACAGGCGGTGTGCCCCTACGATCCACGTCACAACTCCACCTCTGTGCTGGCC 198 

Qy 672 GAT GGGAT GCT CTATT CT GGT ACT AT GAACAACTT C CT GGGCAGT GAGCCCAT CCTGAT G 731 

II I I I I I I I II I I I II I I M I I I I I I I I I I I I 

Db 199 GACAAC GAACT GT ATT C C GGT AC C GT GGCGGAT T T CAGT GGC AGC GAT C C GAT T ATC 255 

Qy 732 C G C ACAC T GG GAT C C C AGC CT GT C CT CAAGAC C GACAACT T CCTCCGCTGGCT GC AT CAT 7 91 

I I I I I I I I I I II I I I I I II | | 

Db 256 T ACC GGGAG C C C CT GC AGAC C GAGCAGT AC GATAGC CT AAGT CT C AAC 303 

Qy 792 GACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAG 851 

I I I I I I I I I I I I I II I I I I II I I II II I I Ml 

Db 304 GCACCGAACTTTGTGAGCTCATTTACGCAGGGCGACTTTGTCTATTTCTTCTTTCGGGAA 363 

Qy 852 ACAGC C AGC GAGTT T GACT T CTT T GAGAGGCT C CACACAT C GCGGGT GGCT AGAGT CT G C 911 

I I I I I Mllll I I I I I M II I I I I I I I II 

Db 364 ACCGCCGTTGAGTTTATCAACTGTGGCAAGGCGATTTATTCGCGCGTTGCCCGCGTCTGC 423 

Qy 912 AAGAAT GAC GT G GGCGGCGAAAAGC T GC T GCAGAAGAAGT GGAC CAC CT T C CT GAAG G C C 971 

II Ml MMI II II M Mill I II I II I II I I I 

Db 424 AAAT GGGACAAAGGT G GC C CGCAT C GAT T C C G CAAC C GCT GGAC AT C CT T C CT CAAGT C C 4 83 

Qy 972 CAGCT GCT CT GCAC C CAGCCGGGGCAGCT GCC CTT CAAC GT CA TC 1016 

III I I I I I.I I I II I II II I I I I I | 

Db 4 84 CGCCTCAACTGCTCCATTCCCGGCGATTATCCTTTCTACTTTAATGAAATCCAATCTGCC 543 

Qy 1017 CGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTC 1076 

Ml III I I IM I I I I I | | || I II I II II 

Db 544 AGCAAT C T GGT GGAG GGACAGTAT GGCT C GAT GAGCT C GAAACT GAT C T AC GGAGT CT T C 603 

Qy 1077 ACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTG 1136 

I I I I I I I I I I M I I II II I I I I I II I I I I I I I 

Db 604 AACAC GC C GAGCAA CTCAATTCCCGGCTCAGCGGTTTGTGCCTTTGCCCTCCAG 657 

Qy 1137 GACATT GAAC GT GTCTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT G- 1195 

I M M II I M I II II I I I I I II I M I M III 

Db 658 GAC AT T GC C GAT AC GT T T GAG G GT CAGT T CAAGGAGCAGACT GG CAT CAACT C CAACT GG 717 

Qy 1196 GACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTG 1247 

I I I I II I I II I I II I I I I I 

Db 718 CT GC CAGT GAACAAC G C CAAGGT ACC C GAT C CT CGAC C C GGT T C CT GT C ACAAC GAT T CG 7 77 

Qy 1248 GGCCCCTCCTCT GAT AAGG C C CT GAC CTT CAT GAAG GAC CAT T T C CT GAT GGAT GAGCAA 1307 

I I I I I I I II II I II I II I M I II I II I 

Db 778 AGAGC G CT T C C GGAT C C CACACT GAACT T CAT CAAAAC ACAT T C G CTAAT G GAC GAGAAT 837 

Qy 1308 GTGGTGG 1314 



Db 838 GTGCCGG 844 

Search completed: May 13, 2004, 15:37:50 
Job time : 222 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 



May 13, 2004, 09:44:40 ; Search time 1271 Seconds 

(without alignments) 
11221.942 Million cell updates/ 



US-10-015-391A-276 
Perfect score: 3143 

Sequence: 1 gggctgaggcactgagagac aaatataaggcttaaaaaaa 3143 



Scoring table: 



Searched: 



IDENTITYjNUC 

Gapop 10.0 , Gapext 1.0 

2947324 seqs, 2269024515 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



5894648 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database : Published_Applications_NA: * 

1 : /cgn2_6/ptodata/2/pubpna/US07_PUBCOMB. seq: * 
2 : /cgn2_6/ptodata/2/pubpna/PCT__NEW__PUB. seq: * 
3: /cgn2__6/ptodata/2/pubpna/US06_MEW_PUB.seq:* 
4 : /cgn2_6/ptodata/2/pubpna/US06_PUBCOMB. seq: * 
5: /cgn2_6/ptodata/2/pubpna/US07_NEW__PUB. seq: * 
6: /cgn2_6/ptodata/2/pubpna/PCTUS_PUBCOMB.seq: * 
7 : /cgn2_6/ptodata/2/pubpna/US08_NEW_PUB. seq: * 
8 : /cgn2_6/ptodata/2/pubpna/US08_PUBCOMB. seq: * 
/cgn2_6/ptodata/2/pubpna/US09AJPUBCOMB. seq: * 
/ cgn2_6/ptodata/2/pubpna/US09B_PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US09C__PUBCOMB. seq 
/cgn2_6/ptodata/2/pubpna/US09_NEW__PUB.seq: * 
/cgn2__6/ptodata/2/pubpna/US09_NEW_PUB. seq2 : 
/ cgn2__6/pt odata/2 /pubpna/US 1 0A_PUBCOMB .seq: 
/cgn2_6/ptodata/2/pubpna/US10B_PUBCOMB. seq: 
/cgn2__6/ptodata/2/pubpna/US10C_PUBCOMB. seq: 
/cgn2_6/ptodata/2/pubpna/US10__NEW__PUB. seq: * 
/cgn2_6/ptodata/2/pubpna/US60_NEW_PUB.seq:* 
/cgn2_6/ptodata/2/pubpna/US60_PUBCOMB.seq: * 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 



Qy 



Db 



61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I ! I I I I I I I 
61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 



Qy 



Db 



121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I 1 I i I I I I I I I I I I I I I I I I I I I I I I I I I I i I II I I I I I II 
121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 



Qy 



Db 



181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I I I I I I I I 

181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 



Qy 



241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 




Db 



241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 



Qy 



Db 



301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 



Qy 



361 



C C T T GGATAT C CAGGAT C CAGGGGT C CC CAG GCT AAAGAACAT GAT AC C GT GG C C AGC C A 42 0 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 



Db 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 420 

Qy 421 GT G AC AG AAAAAAG AGT G AAT G T G C C T T T AAGAAG AAG AG C AAT GAG AC AC AG T GT T T C A 480 

I I I I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 421 GT GAC AGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAG CAAT GAGAC AC AGT GTT T C A 48 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGT CAT GGAG G GAAAAGGC CAAAGC C CCT T T GACC C C G C T C ACAAGCATAC GG 660 

I 1 I I I 1 I I I 1 I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 II I 

Db 601 AGGACAAGGT CAT GGAGG GAAAAGGC CAAAGC CC CT TT GAC C CC GCT C ACAAG CAT AC G G 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 

Db 841 T CT T C GAGGAGACAGC C AGC GAGT T T GACT T C TT T GAGAG GCT C C ACACAT C GCG GGT G G 900 

Qy 901 CT AGAGT CT GCAAGAAT GACGT GGGCGGCGAAAAGCT GCT GCAGAAGAAGT GGAC CACCT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I II I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

I I I I II I I I II I I I I I I I I I I I I II I I I I I I I II I II I I I I I I I I I I I I I I I I I I I II I I 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 T T GAACGT GT CTT T AAGGG GAAAT ACAAAGAGTT GAACAAAGAAACTT C AC GCT GGACT A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T T GAAC GT GT CTT T AAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T C AC G CT GGACT A 12 00 



Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 



1261 ATAAGGC C CT GAC CT T CAT GAAG GAC CAT T T C CT GAT GGAT GAGCAAGT GGT GGGGAC GC 132 0 
! I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I ! I I 1 I I I I I I I I I I II I I I I I ! I I I I I I I 

1261 AT AAGG C C CT GAC CT T CAT GAAG GAC CAT T T C CT GAT G GAT GAGCAAGT GGT G GGGAC G C 1320 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 CCCTGCTGGT GAAAT CT GG C GT GGAGT AT ACACGGCT T GCAGT GGAGACAGC C C AGGGC C 138 0 

1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 144 0 

I II I I I I I I II I I I I I I i I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I I 
1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

14 41 CT GT GGTAAGT GGGGACAGCAGT GCT CAT CTGGT GGAAGAGATTCAGCT GTT CCCT GAC C 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 CTGT GGTAAGT GGGGACAGCAGTGCTCATCT GGT GGAAGAGATTCAGCTGTTCCCTGACC 1500 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 CAGGAGGT GT CT GGAGGGT GCCCC GAGCCAACT GTAGT GT CT AT GAGAGCT GT GT GGACT 1620 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1681 T GT C T GCC CCCAACC T GAACT C CT GGAAGCAG GAC AT GGAGCGG GG GAAC C CAGAGT GG G 174 0 

1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I 
1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 18 00 

18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I II I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

18 61 TGGCCTCT TAT TAT T GGAGT CAT GGC C C AG C AG C AGT C C C AGAAG C CT CT T C C ACT GT CT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 
18 61 T GGC CT CT TAT TAT T GGAGT CAT GGC CCAGCAGCAGT CC CAGAAG CCT CT T C CACT GT CT 1920 

1921 ACAAT GGCT C C CT CT T GCT GAT AGT GCAGGAT GGAGTT GGGGGT CT CTAC CAGT GCT GGG 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1921 ACAAT GGCT CC CT CTT GCT GAT AGT GCAGGAT GGAGTT GGGGGT CT CTAC CAGT GCT GGG 198 0 

1981 CAACT GAGAAT GGCT TTTCATAC CCT GT GAT CT CCTACT GGGT GGACAGCCAGGACCAGA 2040 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 C AACTGAGAAT GGCT T T T CAT AC CCT GT GAT CT C CT AC T GGGT G GACAGC C AGGAC C AGA 2040 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 



Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAG G C C C C GT T AAGCAGAGAGCAACAC CT C CAGT CT C C CAAG GAAT GC AGGAC CT CT G 2340 

I I I I I I I II I I I I I I I I I I I I I I I I I I M I 11 I I I I I I I I I I I I I I I I I I I I I I I I || I I 

Db 2281 AGAAGGCCC CGTTAAGCAGAGAGCAACACCT CCAGTCT CCCAAGGAAT GCAGGACCT CT G 234 0 

Qy 2341 C CAGT GAT GT GGAC GCT GACAACAACT G CCT AGGCACT GAGGTAGCT TAAACT C T AG GCA 2400 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2341 CC AGT GAT GT GGAC GCT GACAACAACT GCC T AG GCACT GAGGTAG CT T AAACT C T AGG C A 2400 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I I I I I I I I i I I I I I II I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I 

Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 2461 T GACT AGGAT GACAGCAGCACAAAAGAC CACCTTT CT CCCCT GAGAGGAGCTT CT GCT AC 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 TGACTAGGAT GACAGCAGCACAAAAGAC CACCTTT CTCCCCT GAGAGGAGCTT CT GCTAC 2520 

Qy 2521 T CT G CAT CACT GAT GAC ACT CAGC AGGGT GAT GCACAGCAGT CTGCCTCC C CTAT GGGAC 258 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 T C T GC AT CACT GAT GAC ACT C AGCAGGGT GAT G CACAGCAGT CTGCCTCC C CT AT GG GAC 258 0 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

Qy 2641 T ACACT GAT AT T GAAGAAC CT GGAGAGGAT C CT T CAGTT CT GG CCAT T C CAGGGAC C CT C 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 2641 TAC ACT GAT AT T GAAGAAC CT GGAGAG GAT C CT T CAGT T C T GGC C AT T C CAGGGAC C CT C 2700 

Qy 2701 CAGAAACACAGT GTTT CAAGAGAC CCTAAAAAACCT GC CT GT C CCAGGAC CCT AT GGTAA 27 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I | I I I M I I I I I I I 
Db 2701 CAGAAACACAGT GTT T CAAGAGAC C CT AAAAAAC CT GC CT GT C CCAG GAC C CT AT G GT AA 2760 

Qy 2761 T GAACACCAAACAT CT AAACAAT CAT AT GCT AACAT GCCACT C CT GGAAACT CCACT CT G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 T GAACAC CAAACAT CTAAACAAT CAT AT G CTAAC AT GC C ACT C CT GGAAACT C CACT CT G 2 820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

I I I I I I I I I I I I I I M I I I M I I I I I I I I I M I I I I I I || I I I I I I I I I I I I I I I I I I I I 
Db 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 



Db 



i I 1 I I I I I I I I I I I i I I I I I I I I I II i I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 



Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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Query Match 100.0%; Score 3143; DB 12; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 3143; Conservative 0; Mismatches 0; 



Length 3143; 
Indels 0; Gaps 



0; 



QY 
Db 



1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I 

1 GG GCT GAGG CAC T GAGAGACC GGAAAGC C T GGC ATT C C AGAG GGAGGGAAAC GC AGC GG C 60 



Qy 



61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 



Db 



I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
61 AT C C C CAGG CT CC AGAGCT C C CT GGT GAC AGT CT GT GG CT GAGCAT GG CC CT C C C AG C C C 12 0 



Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I 1 I I I I I I I I II I I I 1 I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

Qy 241 C AGG GGAT GAAC GT AGGGCAC TT AGCTT CTT C CACCAGAAGGGC CT C C AGGAT T T T GACA 300 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 
Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 3 00 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II I I I I I I I I I II I II I I I I 

Db 361 C CT T G GAT AT C CAGGAT C CAG GGGT C CC CAGG CTAAAGAAC ATGAT AC C GT GGC C AG C C A 420 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAATGAGACACAGTGTTT CA 48 0 

I I I I I I I II I I I i I I I I I I I I II II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 421 GT GACAGAAAAAAGAGT GAAT GT G C CT TTAAGAAGAAGAGCAAT GAGACACAGT GTT T C A 48 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 

Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 C CT T CAGC C CT GCT T GT AC CT T CATT GAACT T CAAGAT T C CT AC CT GT T GC C CAT C T C GG 600 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTT CATT GAACTTCAAGATTCCTACCT GTT GCCCATCTCGG 600 

Qy 601 AGGACAAGGT CAT GGAGGGAAAAGGCCAAAGC CCCTTT GACCCCGCTCACAAGCATACGG 660 

II I I I I I II II I I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AG GACAAGGT CAT GGAGGGAAAAGGC CAAAG C C C CT TT GACC CC GCT C ACAAGC AT AC GG 660 

Qy 661 CT GT CTT GGT G GAT G GGAT GCT CT AT T CT G GT ACT ATGAACAACTT CCT GGGC AGT GAG C 72 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I II I I I II I I I I 

Db 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

Qy 901 CT AGAGT CT GCAAGAAT GACGT GGGCGGC GAAAAGCT GCT GCAGAAGAAGT GGACCACCT 960 

I I I I I I II I I II I I I II I I I I I I I I II I M I I I I I I 1 1 I I I I I I I I II I I I I I I I I M I I 



Db 901 CTAGAGT CT GCAAGAAT GACGT GGGC GGC GAAAAGCT GCT GCAGAAGAAGTGGACCACCT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I i I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I | | | I | | | | | | I | 

Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I ! I I I I I II I I I I I I I I I 1 I I I I I I I I I I I I I I | | | | | I 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 TT GAACGT GT CT TTAAGGGGAAAT ACAAAGAGTT GAACAAAGAAACTT CACGCTGGACT A 1200 

M! I I I I I I I I I I M I I I I I I I I | | I I | I || | | | | | | M I I I I I II I II I I I I I 

Db 1141 T T GAAC GT GT CT T T AAGGG GAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GC T G GACT A 1200 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

Qy 1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ATAAGGC C C T GAC CT T CAT GAAG GAC CAT T T C CT GATGGAT GAGC AAGT GGT GG GGAC GC 1320 

Qy 1321 CCCT GCT GGT GAAAT CT GGC GT GGAGTATACACGGCTT GCAGT GGAGACAGCC CAGGGC C 1380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 TT GAT GGGCACAGCCAT CTT GT CAT GTACCT GGGAACCAC CACAGGGT CGCT C CACAAGG 1440 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I || I I I I I I I I || | | | | | | | | 

Db 1381 T T GAT GGGCACAGCCAT CT T GT CAT GT AC CT G GGAACC AC CACAGGGT C G C T C C ACAAG G 1440 

Qy 1441 CT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT CAGCT GTT CCCT GACC 1500 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I II 
Db 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I II I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAG GT GT CT GGAGGGT GCC C CGAGC CAAC T GT AGT GT CT AT GAGAGCT GT GT GGACT 1620 

I I I I I I I I I I I I I I I I I I I I I !! I I I I I I i I I I I I I I I I I I I I ! I I I 1 I I I | | I I I I I I I 

Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I M I I I I I I I II I I I I I I I I I I || I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | I | I I I I I I I I I I I I I I 

Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I 1 I I I I M I I I I I I I I I I I I I i I I I I I I II I I I I I I I I I I I I I II I I I I I I I II 
Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 



Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I 1 I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I i II I I I I I 1 I I I I I I I I I I I I I I I I 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I 

Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

II I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 1981 CAACT GAGAAT GGCT TT T CAT AC C CT GT GAT CT CCT ACT GGGT G GAC AGC C AGGACCAGA 2040 

I I I I II I I I I I I II I I I I I I I i I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I i I I I 
Db 1981 CAAC T GAGAAT GG CTTT T CAT AC C CT GT GAT C T C CT AC T GGGT G GAC AGC C AGGAC CAGA 204 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I i I I I I I I I I I 

Db 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I II I I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

Qy 2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCT CCAGT CT CCCAAGGAAT GCAGGAC CT CT G 234 0 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 AGAAGGCCCCGTTAAGCAGAGAGCAACAC CTCCAGT CT CCCAAGGAAT GCAGGACCT CT G 2340 

Qy 2341 CCAGT GAT GT GGACGCT GACAACAACT GC CT AGGCACT GAGGTAGCTT AAACT CTAGGCA 2400 

I I I I I I II I I I I I I I M I I I I I I I I II I I I II I I I I I I I I I I I I I I I I II I I I I I I I I II 

Db 2341 CCAGT GAT GT GGACGCT GACAACAACT GC CTAGGCACT GAGGT AGCTTAAACT CTAGGCA 24 00 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2461 T GACT AG GAT GACAGCAGC ACAAAAGAC CACC TT TCTCCCCT GAGAGGAGCTT CT GCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2461 T GACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCT GAGAGGAGCTT CT GCTAC 2520 

Qy 2521 T CT GCAT CACT GATGACACT CAGCAGGGT GAT GCACAGCAGT CT GCCT C C CCTAT GGGAC 2580 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GC C T C CC CT AT GGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 



Qy 2641 T ACACT GAT AT T GAAGAAC CT G G AGAGGAT C C T T CAGT T C T G GC CAT T C CAGGGAC C CT C 2700 

I I I I I I I I I I I I I I I I I I i I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 T ACAC T GAT AT T GAAGAAC CT GGAGAGGAT C CT T CAGT T CT GGC CAT T C C AG GGAC C C T C 2700 

Qy 2701 CAGAAAC AC AGT GT T T CAAGAGACCCTAAAAAAC CT GC CT GT C C CAGGAC C CT AT GGT AA 2760 

I I I I II I I I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I II I I II I I I I I I II I I I I 

Db 2701 CAGAAACACAGTGTTTCAAGAGAC C CTAAAAAAC CT GC CT GT CC CAGGAC C CT AT GGTAA 2760 

Qy 2761 T GAAC AC CAAACAT C TAAACAAT CAT AT GCTAAC AT GC CACT C CT GGAAACT CCACT CT G 2820 

I I I I I I 1 I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I II I I 

Db 2761 T GAACAC CAAACAT CTAAACAAT CAT AT G CT AACAT GC C ACT C CT G GAAACT C CAC T CT G 2820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 880 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I II I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 

Qy 3121 TAAAAATAT AAGGCT T AAAAAAA 3143 

I I I I I I I I I I II I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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Query Match 100.0%; Score 3143; DB 13; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
Qy 1 GGGCT GAGGC ACT GAGAGAC C GGAAAGC C T GGCATT C CAGAG GGAGGGAAAC GCAGC GGC 60 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I ! I I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I I I I I I I I I I I I I I I II I I I 1 I II I I I I I I I I I II I I I I ! I I I I I I I I I I I I I I I I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I II I II I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II II II I I II I 
Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CT CT GCT C CT GAGT GGT GAT GGAAAT ACT CT CTAC GT GG GGGCT C GAGAAGC CAT T CT GG 360 

I I I I I I I I I II I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T GGAT AT C CAGGAT C C AGGGGT C CC CAGG CT AAAGAAC AT GATACC GT GGCC AGC CA 420 

I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 361 C CT T GGAT AT C CAGGAT C C AGGG GT C CCCAGG CT AAAGAAC AT GAT AC C GT GG C CAG C C A 42 0 

Qy 421 GT GACAGAAAAAAGAGTGAAT GT GCCTTTAAGAAGAAGAGCAAT GAGACACAGTGTTTCA 4 80 

I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GT GAC AGAAAAAAGAGT GAAT GT GC C T T TAAGAAGAAGAGCAAT GAGAC ACAGT GT T T CA 48 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 



601 



661 



I I I I I I I I I I I I I I I I I I I I I ! I I I I I I II I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 

AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 



CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I i I I I 
661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 

721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 
I I I I I I I I M M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | | | | 
721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 

781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 
I I I I I I I I I I I II I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
7 81 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 

841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I | I I 
841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 



901 



901 



961 



CT AGAGT CT GCAAGAAT GACGTGGGCGGCGAAAAGCTGCT GCAGAAGAAGT GGAC CAC CT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT AGAGT CT GCAAGAAT GAC GT GGGCGGC GAAAAGCTGCT GCAGAAGAAGT GGAC CAC CT 



TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 

I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II M I I I I I I II I M I I I I I 

9 61 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 



660 



720 



720 



780 



780 



840 



840 



900 



900 



960 



960 



1020 



1020 



1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

M I I I I II I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 10 8 0 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

1141 T T GAACGT GT CTT TAAG GGGAAAT ACAAAGAGTT GAACAAAGAAACT T C AC GCT G GACT A 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 T T GAAC GT GT C T T TAAGG GGAAAT ACAAAGAGTT GAACAAAGAAACT T CAC GCT GGACT A 1200 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

12 61 AT AAGGC CCT GAC CTT CAT GAAG GAC CATT T C CT GAT GGAT GAGCAAGT GGT G G GGACGC 1320 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

12 61 AT AAGGC CCT GAC CT T CAT GAAG GAC CATT T C CT GAT GGAT GAGCAAGT GGT GGGGAC G C 132 0 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 13 80 

1381 TT GAT GGGCACAGCCAT CTT GT CAT GTACCT GGGAACCACCACAGGGT C GCT C CACAAGG 144 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 T T GAT GG GCAC AG C C AT CT T GT CAT GT AC C T GGGAACCAC CAC AG GGT C GCT C CACAAGG 14 4 0 

1441 CT GT GGT AAGT GG G GAC AGC AGT GCT CAT CT GGT GGAAGAGAT T CAGCT GT T C C CT GAC C 1500 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | I I I II I I I I I I I I I I I I I I I I I II M I I 



Db 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I i I II I I I I I I I I I I I I I I I I I II I I 1 I I I I I I I I i I I I I I I I I I I I I I I 

Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 C AGGAGGTGT CT GGAGGGT GC CC CGAGC CAACT GT AGT GT CT AT GAGAG CT GT GT GGACT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 162 0 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I II I I I I I I I I I I I I 

Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

Qy 1741 CAT GT GC C AGT GGC C C CAT GAGCAG GAG CCTTCGGCCT CAGAGC C G C C C GCAAAT CAT T A 18 00 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

ii 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n 1 1 1 1 1 1 1 1 1 1 

Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I 

Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAACT GAGAAT GGCTTTT CATAC CCT GT GAT CT C CT ACT GGGT GGACAGCCAGGACCAGA 2040 

I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1981 CAACT GAGAAT GGCTTTT CATAC C CT GT GAT CT CCT ACT GGGT GGAC AG C C AGGAC C AGA 2 04 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAG G C C C C GT TAAGCAGAGAGCAACACCT CCAGT CT C C CAAGGAAT GC AG GAC CT CT G 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 22 81 AGAAGGC CC C GT TAAGC AGAGAG CAACAC CT CCAGT CT CC CAAGGAAT G C AG GAC CT CT G 2340 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 24 00 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I! I I 11 

2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 
24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I II I I I I I I I I I I I I I I I I I I I 1 1 I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 
2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2520 

I I I I I I II I I I I I I I I I I I II I I I I I I ! I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

24 61 T GACT AG GAT GAC AGCAGC ACAAAAGAC CAC CT T T CT CC CCT GAGAG GAGCT T CT GCT AC 2520 

2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GC ACAGC AGT CT GCCTCCCC TAT G GGAC 2580 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 T CT G CAT CACT GAT GACAC T CAGCAGGGT GAT GC ACAGC AGT CT GCCT CC CC TAT GGGAC 2580 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I M I I I I I I I I I I I 1 I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

2641 T AC ACT GAT AT T GAAGAAC CT G GAGAGGAT CC T T C AGTT CT GGC CAT T C C AG GGAC CCT C 2700 

I I I I I I I I M I I I I I I I I I I I II I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2641 T ACACT GAT AT T GAAGAAC CT G GAGAGGAT CCT T C AGTT CT GGC CAT T C C AG GGACC CT C 2700 

27 01 C AGAAAC AC AGT GT T T C AAG AGAC C C T AAAAAAC CTGCCTGTCC C AG GAC C C TAT G GT AA 27 60 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2701 CAGAAAC ACAGT GTT T CAAGAGAC C CT AAAAAAC CTGCCTGTCC C AGGAC C CT AT GGT AA 2760 

2761 T GAACAC CAAACAT CT AAACAAT CAT AT GCT AAC AT GC C ACT C CT GGAAAC T C CACT CT G 2820 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I 
2761 T GAACAC CAAACAT CTAAACAAT CAT AT GCTAACAT GCCACTCCT GGAAACT CCACT CT G 2820 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 8 80 

28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I 1 I I I I I I I I I I I I I I I 
3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 4 

US-10-013-907A-276 

Sequence 276, Application US/10013907A 
Publication No. US20030064925A1 
GENERAL INFORMATION: 
APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan 1. 
APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C34 

CURRENT APPLICATION NUMBER: US/10/013, 907A 
CURRENT FILING DATE: 2001-12-10 

Prior Application removed - See File Wrapper or Palm 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 276 
LENGTH: 3143 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-013-907A-276 



Query Match 100.0%; Score 3143; DB 13; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 3143; Conservative 0; Mismatches 



Length 3143; 
0; Indels 0; Gaps 



0; 



Qy 

Db 



GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 6 0 

I I I I I I II I 1 1 I II I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I 

GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 6 0 



Qy 

Db 

Qy 

Db 



61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I II I I II I I I I I I II I I 

61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

I II I I I I I I I II I I II I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I I I 

121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 



Qy 

Db 

Qy 

Db 



181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 

181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
241 C AGGGGAT GAAC GT AGGGC ACT T AGCT T CT T C CAC C AGAAGGGCC T C C AGGATT TT GAC A 300 



Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T G GAT AT C CAG GAT C C AG G G GT C C C C AGG CT AAAGAAC AT GAT AC C GT G GC C AG C C A 42 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 C CT T G GAT AT C CAGGAT C CAGGGGT C C C C AG GC T AAAGAACAT GAT AC C GT GGC C AG C C A 420 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GCCTTT AAGAAGAAGAGCAAT GAGACACAGT GTT T CA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAG C AAT GAGACACAGT GT T T C A 480 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I II I 

Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCAT GGAGGGAAAAGGC CAAAGCCCCTTT GACCC CGCTCACAAGCATACGG 660 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 601 AGGACAAGGT CAT GGAGGGAAAAG G C CAAAGC C C CT TT GAC CC C G CT CACAAGC AT AC GG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 C C AT CCT GAT G CGC AC ACT GGGAT CC CAGC CT GT C CT CAAGAC C GACAACT TCCTCCGCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 T CT T C GAGGAGACAGC CAGCGAGT T T GACTT CTTT GAGAGGCT C CAC ACAT C GC GGGT GG 900 

I I I I I I I i I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 T CT T C GAGGAGACAGC CAGC GAGT TT GACT T CT T T GAGAGG CT C CACAC AT CG C G GGT G G 900 

Qy 901 CT AGAGT CT G C AAGAAT GAC GT GG GC GGC GAAAAGC T GCT G C AGAAGAAGT GGAC CAC C T 960 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I I 

Db 901 CT AGAGT CT GCAAGAAT GAC GT GG GC GG C GAAAAGC T GCT GCAGAAGAAGT G GAC CAC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I II I I I I II I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I 

Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

Qy 1141 T T GAAC GT GT CTT T AAGG GGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT GGAC T A 1200 



Db 


1141 


T T GAAC GT GT CT T TAAG GGGAAATACAAAGAGTT GAACAAAGAAAC TT CAC GCT GGACT A 


1200 


Qy 


1201 


CTTATAGGGGCCCTGAGACCAAPPPPPG(^p^AGf4PAGTTGPTPAPTPPPPpppT^rTrT^ , 

v x x -fx J. nuvjuvj^'u^ j. o-nun.^- v-'X \_, \^ u u \_, U v-'ZvU x X Ov-*- X ^nu X bbbLLLL J. L L X L X b 


1ZDU 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 ! 1 I 1 1 1 1 1 1 1 1 1 1 I I I I I I I | | | | | 




Db 


1201 


CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 


1260 


Qy 


1261 


AT AAG G C C CT GAC C T T CAT GAAGGAC CAT T T C CT GAT GGAT G A GP A A GT GGT GGGG A r GC 


1 JiU 






1 1 1 1 1 1 II 1 1 1 1 ! 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 




Db 


1261 


ATAAGGCC CT GAC CTT CAT GAAGGAC CATTT CCTGAT GGAT GAGCAAGT GGT GGGGACGC 


1320 


Ov 


1321 


CCOTGPTGGTGAAATPTGGPGT^PA^TATAPAPft^PTTPPAPTPr^APAp ixrrrrArrrrr 

V* Vy X X UU X UnnnX X UUV^U X OOn.O X x\. X n^»n.b UVJ^ X X OLnU X b bnbn.Ln.b b L L</t.U b b b L 


lJoU 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I I I I I 




Db 


1321 


CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 


1380 


Ov 

v.y 


1381 


TT GAT GGGC AC AGC C ATPTTPTP ATriT APPTfiPPA APP arr AP APPPTr , r 4 r , Tr , r' Ar*a arr 

x x onx uuu u.n^n.u ^ v^n. x ^>x x ox bn.X olA^Ol ouannL^/iULnLrtobb I ^ovyi LLnLnnbb 


i a a n 

144U 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I I I I 




Db 


1381 


TT GATGGGCACAGC CATCTT GT CAT GTACCT GGGAACCACCACAGGGT CGCT CCACAAGG 


1440 


Ov 


1441 


x o x ovjinno x oooun^na^nu x x bnX L x X b bnnbnbn. X 1 bnbb ibl luLLl bn.LL 








1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


CT GT GGTAAGT GG GGACAG C AGT G CT CAT CT GGT GGAAGAGAT T C AGCT GT T CC CT GAC C 


1500 


Ov 


1501 


CTGAAPPTGTTPGPAAPPTPPAPPTf^riPPPPPAPPPAPPPTPPAPTPTTTrT ArrrTTPT 

^ x unn^^ x \j ± x u u "<_>nn^> <^ X OLn.OL X b b b b b b LnL L Lnb b b X bbnb lul X X b X n.bbb 1 i LI 


IjDU 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 


1560 


Ov 


1561 


PAGGAGGTGTPTPPAPPPTPPPPPPAPPP AAPTPT ACTHTTTATr AP arrTfTrTrr apt 

^^Ov7iT.v-fv7 x ox x OOn.000 x >J^^v^^ijr\aU^nn.L. X b X n.b IvjIL X ril bnbn.bb IoIIjI bbnb X 


i con 

1 oz u 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | M 1 1 1 




Db 


1561 


CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 


1620 


Ov 
^y 


1621 


fiTPTPPTTPPPPPPPAPPPPP ArTCT^rrT^^ArrrTrArTrrrr' a ^{^^^{^^'^^(^1^1^'^ 

ox ox x x o UO ^^LV/AL X OX uLL- X bbbnbbb X bnb X LUL bnnb b lull bL-L- X LL 


1 DO U 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


1621 


GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCG7\ACCTGTTGCCTCC 


1680 


Ov 


1681 


TPTPTPPPPPP AAPPTPA APTPPTPPA Af^P a^CAr AT Pr* nccrcnrr a is.r*rr ararTrrr 

x ox b x u^^^V- bnnb b x OnnL X bb X OUrtAuLrVuijALnl uunbLuuobbnnLL.Ln.bAu X bbb 


~\ 1 A C\ 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1681 


TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 


1740 


Ov 
«y 


1741 


CATGTGCCAGTGGPPPPATPAPPAPPAPPPTTPPPPPTP APAPPPPPPPPP A A ATP ATT A 

v^-n.x u x u ws->no x oo^^v^^nx OnOLn.Obn.OLL X X bbbbb X bnbnbrbbbbbbbbnnnX bnX 1a 


i ft n n 

10UU 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1741 


CATGTGCCAGTGGPCPPATGAGPAPrPAPPPTTPPPPPTPAPAPPPPPPPPPA A ATP ATT A 

\. a. w -l. v^j > — ■ ±. ^ — i vii ± \Ji\\J v^-^i-U^ ^U^i.U v^- X i uuuvul vAuAuvvvvvV/uvAAfil L<A1 X il 


1 ftnn 

lOUU 


Ov 
vy 


1801 


AAGAAGT CPTGGPTGTPPPP A APTPPATPPTnr^Af^PTPPPPTPPPPPP APPTPTP APPPT 

nn.unn.u x x oov^ x u x ^^/^^nnv^. X ov_^n.X LL X OOnOL X LLLL X bLLLLLnLL 1 bl LnbLL X 


i ocn 

lOOU 






1 1 1 1 M 1 i i M 1 M 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 | | | | II | | | | II 1 || 




Db 


1801 


AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 


1860 


Qv 


1861 


TGGCCTCTTATTATTGGAGTCATGGCPCAGPAGPAftTPPPAGAAftPPTPTTPPAPTPTPT 


x. z> c, \j 


Db 


1861 


1 1 1 1 1 1 M 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | 1 1 1 1 1 1 1 1 1 1 I I | 1 1 1 1 I | | | 1 1 1 1 

T GGC C T CT T ATT AT T GGAGT CAT GGC C CAGCAGCAGT C C CAGAAG CC T CT T C C ACT GT CT 


1920 


Qy 


1921 


ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 


1980 






II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 II I I I I I 1 1 I I I | I 1 1 I I 




Db 


1921 


ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 


1980 


Qy 


1981 


CAACT GAGAAT GGCTT TT CATAC C CT GT GAT CT C C TACT GGGT GGACAGC C AGGAC C AGA 204 0 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1981 CAACT GAGAAT G G CT TT T CAT AC C CT GT GAT CT C C T ACT G GGT GGAC AG C C AGGAC C AGA 2040 
2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 
2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

2281 AGAAGGC CCCGTTAAGCAGAGAGCAACACCTC CAGTCT CCCAAGGAAT GCAGGACCT CT G 2340 

I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2281 AGAAGGC C C C GTTAAGC AGAGAGCAAC AC CT C C AGT CT C C CAAG GAAT GC AGGAC CT CT G 2340 

2341 C CAGT GAT GT GGAC GCT GACAACAACT GCCT AGGCACT GAGGT AGCT T AAACT CT AG GCA 2400 

I I I I I I I II II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
2341 C CAGT GAT GT G GACGCT GACAACAACT GC C TAGGCACT GAGGT AG CT TAAAC T CT AGGC A 2400 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 
I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

2461 T GACT AGGAT GACAGCAGC ACAAAAGAC CACCTT T CT C CC CT GAGAGGAG CTT CT GCT AC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
2461 T GACT AGGAT GACAGC AG C ACAAAAGAC CACCTT T CT C CC CT GAGAGGAGCT T CT GCT AC 2520 

2521 T CT GC AT CACT GATGAC ACT C AGC AG GGT GAT GC ACAGCAGT CT GCCT C C C CT AT GGGAC 258 0 

I I I I I I I I II II I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
2521 T CT GCAT CACT GAT GAC ACT CAGCAGGGT GAT GC ACAGCAGT CTGCCTCCC CT AT GGGAC 2580 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
2581 T C C CT T CT AC CAAGC AC AT GAGCT CT CTAACAGGGT GGGG GC T AC C C C C AGAC CT GCT C C 2640 

2 641 T AC AC T GAT AT T GAAGAAC CT G GAGAGGAT CCTT CAGT T CT GGC CAT T CCAGGGACC CT C 2700 

I I I I I I I II II I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2641 T ACAC T GAT AT T GAAGAAC CT GGAGAGGAT CCTT CAGT T CT G GC CAT T C CAGGGAC C CT C 2700 

2701 C AGAAAC ACAGT GTT T C AAGAGAC C CTAAAAAAC CT GC CT GT CC CAGGAC C CT AT GGT AA 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 CAGAAAC AC AGT GT T T C AAGAGAC C CTAAAAAAC CTGCCTGTCC CAG GAC C CT AT GGT AA 27 60 

2761 T GAAC AC CAAAC AT CTAAACAAT C AT AT GC TAAC AT GC CACT C C T GGAAACT CCACT CT G 2 82 0 

II I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

2761 T GAACAC CAAAC AT CTAAACAAT CATAT GCTAACAT GCCACT C CT GGAAACTCCACTCT G 2 82 0 

2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 



QY 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

I M I I I I I I I I I I I I I I M I I I I I I II I I I I I I i I I I I I I II I I I I I I I I I I I I I I I I I I 
28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 30 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I 1 I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I 1 II I I I I I I I 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 5 
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Query Match 100.0%; Score 3143; DB 13; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 1 G G G CT GAGG C ACT GAGAGAC C GGAAAGC CT G G CAT T CC AGAGGGAGGGAAAC GC AG C GGC 60 

I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I 1 I M I I I I 1 I I I I I I I I I I I I I I I I I I I 
Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I II I I I I I I I I I I I I I I I i 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I II 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | I I I 
Db 241 C AGG GGAT GAAC GTAGGGCACT T AG CTT CT T C CAC CAGAAGGGC CT C C AG GAT T T T GAC A 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T GGAT AT C CAGGAT CC AGGG GT CC C CAGGCTAAAGAAC AT GAT AC C GT GGC CAGCC A 420 

I I I I I I I I I II I I I I I II I I M I II I II I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I 

Db 361 C CT T GGAT AT C CAGGAT C C AG GGGT C C C C AGGC TAAAGAAC AT GAT AC C GT GGC C AGC CA 42 0 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGAC AC AGT GTT T C A 48 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CT T TAAGAAGAAGAGCAAT GAGACACAGT GT T T C A 4 80 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 60 0 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 C CAT C CT GAT GC GCACACT GGGAT C C CAGC CT GT CCT CAAGACCGACAACT TCCTCCGCT 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 



Qy 841 T CT T C GAG GAGACAG CCAGC GAGT T T GACT T CT T T GAGAG GC T C C ACAC AT CGCGGGTGG 900 

I I I I I I I II I I ! I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACAT CGCGGGTGG 900 

Qy 901 CTAGAGT CT GCAAGAAT GACGT GGGCGGC GAAAAGCTGCT GCAGAAGAAGT GGAC CACCT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 901 CTAGAGT CT GCAAGAAT GAC GT GGGCGGC GAAAAGCTGCT GCAGAAGAAGT GGAC CAC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

Qy 1141 TTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T T GAAC GT GT C TT TAAGG G GAAATACAAAGAGT T GAACAAAGAAACT T C AC GCT G GACT A 12 00 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I 

Db 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 1261 ATAAGGC CCTGAC CTTCAT GAAGGAC CATTT CCT GATGGATGAGCAAGTGGT GGGGACGC 1320 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 ATAAG GC CCT GAC CT T CAT GAAGGAC CAT T T C CT GAT GGAT GAG CAAGT GGT GGG GACG C 1320 

Qy 1321 CC CTGCT GGT GAAAT CT GGCGTGGAGT AT ACACGGCTT GCAGT GGAGACAGC CCAGGGCC 138 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 13 81 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 144 0 

I I I I I I I I I I I I I II I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

Qy 1441 C T GT G GT AAGT GGGGACAGC AGT GCT CAT CT G GT GGAAGAGAT T C AG C T GT T C C CT GAC C 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CT GT GGT AAGT GGGGACAGC AGT GCT CATCT GGT GGAAGAGAT T C AG CT GTT C CCTGAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I II I I I I I 1 I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 C AGGAGGT GT CT G GAGG GT G C C C C GAGC C AACT GT AGT GT CT AT GAGAGCT GT GT G GAC T 1620 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 162 0 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I II I I I I I I I II 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 



1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I II I I I I I I I I I I I I I I 
1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 1 M I I I I I I I I I I I I I 

1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 192 0 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

I I i I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

1981 CAACT GAGAAT GGCTT TT CAT AC CCT GT GAT C T C CT ACT GG GT GGACAGC C AGGACC AGA 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I 
1981 CAACT GAGAAT GGCTT TT CAT AC CCT GT GAT CT C CTACT GGGT G GACAGC CAG GAC C AGA 2040 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I II I I I II I 
2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I II I 
2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I 
2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

2281 AGAAGGC C CC GT T AAG CAGAGAGCAACACCT C CAGT CT C CCAAG GAAT GC AGGAC CT CT G 2340 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I 

2281 AGAAGGC C C C GT TAAGCAGAGAG C AACAC CT C C AGT CT C CCAAGGAAT G CAG GAC CT C T G 2340 

2341 CCAGT GAT GT GGACGCT GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACT CT AGGCA 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

2341 CCAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT GAGGTAGCTTAAACT CT AGGCA 2400 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

2461 T GACT AGGAT GACAGCAGCACAAAAGAC CAC CTTT CT CCC CT GAGAGGAGCTT CT GCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I II 

2461 T GACTAGGAT GACAGCAGCACAAAAGAC CAC CTT T CT CC CCT GAGAGGAGCTT CT GCTAC 2520 

2521 T CT GCAT CACT GATGACACTCAGCAGGGT GAT GCACAGCAGT CT GCCT CCCCT AT GGGAC 2580 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 



2521 T C T GCAT CACT GAT GACACT C AGCAG GGT GAT GC ACAGCAGT CTGCCTCCC CT AT GG GAC 2580 



Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 1 II I I II I I I I I I I I I I II I I I I 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

Qy 2641 TACACT GATATT GAAGAACCT GGAGAGGATCCTT CAGTT CTGGCCATT CCAGGGACC CT C 2700 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 TACACT GATATT GAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCATT CCAGGGACCCT C 2700 

Qy 2701 C AG AAAC AC AG T GT T T C AAG AG AC C C T AAAAAAC CTGCCTGTCC C AG GAC C C TAT G G T AA 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 C AGAAACACAGT GT T T CAAGAGAC C C T AAAAAAC CTGCCT GT C C CAGGAC C CT AT GGT AA 2 760 

Qy 2761 T GAACAC CAAAC AT CTAAACAAT CAT AT GCT AAC ATG C CACT C CT GGAAACT C CACT CT G 2820 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 T GAACAC CAAACAT CTAAACAAT CATAT GCTAACATGCCACT CCTGGAAACTC CACT CT G 2 82 0 

Qy 2821 7VAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3 060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAAT ATAAGGC T T AAAAAAA 3143 

I I I I I I I I I I I I I I I I II I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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Query Match 100.0%; Score 3143; DB 13; Length 3143; 
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Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 G GGCT GAGGC AC T GAGAGAC C G GAAAGC CT G GCAT T C CAGAG GGAGG GAAAC GCAGC GGC 60 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I i I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 



Qy 181 T GC C GAC GAC GAC C GC GG GGG GAGG C GG G CAGGGGC C CAT GC C C AGG GT C AGAT ACT AT G 240 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 



Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I 
Db 241 C AGGGGAT GAAC GT AGGGC AC T T AGCT T CTT CC AC CAGAAGGG C CT C CAG GATT T T GACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CC TT GGAT AT C CAGGAT C C AG GGGT CC C CAG GCTAAAGAACAT GAT AC C GT GGC C AGC CA 420 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I I 
Db 361 C C T T GGAT AT CC AGGAT C CAG GGGT C C C CAG GCTAAAGAACAT GAT AC C GT GGC CAGC CA 420 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GC CTT T AAGAAGAAGAGCAAT GAGACAC AGT GTT T CA 4 80 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 4 8 0 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGT CAT GGAGGGAAAA.GG C CAAAGC C C C TT T GAC CCCGCT CACAAGC AT AC GG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 601 AGGACAAGGT CAT GGAGGGAAAAGGC CAAAG CC C CTT T GAC CCCGCT CACAAGC AT AC GG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

Qy 721 C CAT C CT GAT GCGCACACT GGGAT CC CAGCCT GT C CT CAAGACCGACAACTT CCT C C GCT 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 721 C CAT CCT GAT GC GCAC ACT GGGAT C C CAGCCT GT C CT CAAGAC CGACAACT T CCT C CGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

Qy 841 T CT T C GAGGAGACAGC CAGC GAGT T T GAC TT CT T T GAGAGGCT C C AC AC AT C GC GG GT GG 900 

I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I II I I I I I 1 I II I I I I I I I I II II 
Db 841 T CT T C GAGGAGACAGC CAG C GAGT TT GACT T CT TT GAGAGG CT C CACACAT C GC GG GT GG 900 

Qy 901 C T AGAGT CT GCAAGAAT GAC GTGGGC GGC GAAAAGCT GC T GCAGAAGAAGT GGACCAC CT 960 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CTAGAGTCT GCAAGAAT GAC GTGGGC GGC GAAAAGCT GCT GCAGAAGAAGTGGACCACCT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 



Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 TT GAACGT GT CTTTAAGGGGAAATACAAAGAGT T GAACAAAGAAACT T CAC GCT GGACT A 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 1141 T T GAAC GT GT CTT T AAGG GGAAAT ACAAAGAGTT GAACAAAGAAAC T T CAC GCT GGACT A 12 00 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 12 61 ATAAGGC C CT GAC CT T CAT GAAGGAC CAT T T C CT GAT GGAT GAGCAAGTGGT GGGGACG C 1320 

I I I I I I I I I I I I I I I I I II I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1261 ATAAGGC C C T GAC CT T CAT GAAGGAC CATT T C CT GAT G GAT GAG CAAGT GGT GGGGACGC 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 T T GAT GG GCACAGCC AT CT T GT CAT GT AC CT GGGAACCAC CACAGGGT C GCT C C ACAAGG 1440 

I I i I I I I I I I I I I I I I 1 1 I I 1 1 1 1 I 1 1 I II I I I I I 1 1 1 i I I I I I I II I I I I I I I 1 1 1 1 1 I 

Db 1381 T T GAT GGGCAC AGCCAT CT T GT CAT GT AC CT GGGAACCAC CACAGGGT C GCT C CACAAG G 1440 

Qy 1441 C T GT G GT AAGT GGGGACAGCAGTGCT CAT CT GGT GGAAGAGATT CAGCT GTT C CCT GAC C 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I 
Db 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I II I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGT GT CT GGAGGGT GCCCCGAGCCAACT GTAGT GT CT AT GAGAGCT GT GT GGACT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I II I I 
Db 1561 CAGGAGGT GT C T GGAGGGT GCC C C GAG C CAACT GTAGT GT CT AT GAGAG CT GT GT GGAC T 162 0 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCC C AAC C T GAACT C CT GGAAGC AGGACAT GGAGC G G G G GAAC C C AGAGT G GG 174 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 1 I I I I I I I I II I I I I I I I I I I I I I I 

Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I 

Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 18 00 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I M II I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 

Db 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 AC7\ATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 



I 1 I I I I I I I I I ! I I 1 I I I 1 I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 19 81 C AAC T GAGAAT GGCT T T T CAT AC C C T GT GAT C T C CT AC T GG GT G GACAG C C AGGAC C AGA 2 040 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I II I I I II I I I I I I I I I 

Db 1981 CAACT GAGAAT GG C T T T T C AT AC CCT GT GAT CT C CT ACT GGGT G GAC AGC C AG GAC C AGA 204 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

Qy 2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 2340 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 22 81 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 234 0 

Qy 2341 C CAGT GAT GT GGACG CT GACAACAACT GC CTAGG CACT GAGGTAG CTTAAACT CTAGGC A 24 00 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 2341 C CAGTGAT GT GGAC GCT GACAACAACT GCCTAGGCACT GAGGTAGCTTAAACT CTAGG CA 2400 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2520 

I I M I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 T GACTAGGAT GACAGCAGCACAAAAGACCACCTTT CT CCCCT GAGAGGAGCTT CTGCT AC 2520 

Qy 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GCCT CC CCTAT GGGAC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2521 T CT G CAT CAC T GAT GAC ACT CAG CAG GGT GAT GC ACAG CAGT CT G CC T C CC CT AT GGGAC 258 0 

Qy 2581 T CCCTT CT ACCAAGCACAT GAGCTCT CTAACAGGGT GGGGGCTAC CCCCAGAC CT GCT C C 2640 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2 641 T AC AC T GAT AT T G AAGAAC C T G GAG AG GAT C C T T CAGT T C T G G C CAT T C CAG G GAC C C T C 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2641 TACACT GAT ATT GAAGAACCTGGAGAGGAT CCTT CAGT T CT GGCCATT C CAGGGACCCT C 2700 

Qy 27 01 CAGAAAC ACAGT GTT T CAAGAGACC CTAAAAAAC CT GCCT GT C CCAGGAC C C TAT G GTAA 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | I I I | I I I I I I I I M I I I 
Db 27 01 C AGAAACACAGT GTT T CAAGAGAC CCTAAAAAAC CTGCCTGTCC CAGGAC C CT AT GGT AA 2760 

Qy 27 61 T GAACACCAAACAT CTAAACAAT CAT AT GCT AACAT GCCACT C CT GGAAACT CCACT CT G 2820 

I I I I M I I M I I I I I I I I I II I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



2761 



T GAAC AC CAAAC AT CT AAACAAT CAT AT GC T AAC AT GCCACT C C T GGAAACT C C AC T CT G 282 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 8 80 
I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I 1 I I I I I i I I I I I I I I I 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I I 1 I I I I I I I I I I I I I I i II I I I I I I I I II I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I II 
2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I II I I I II i II I I I I I II I I I I I I I II I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 
2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II I I I 
3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

3121 TAAAAAT ATAAGG CTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I II I I I I I 

3121 TAAAAAT AT AAGG CT T AAAAAAA 3143 
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US-10-006-856A-276 



Query Match 100.0%; Score 3143; DB 15; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 G G GCT GAGGC ACT GAGAGAC C GGAAAGC CT GGC AT T C C AGAG GGAGGGAAAC GCAGC GGC 60 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 
Db 1 GGGCTGAGGCACT GAGAGAC CGGAAAGCCTGGCATTCCAGAGGGAGGGAAAC GCAGC GGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 361 CCTT G GAT AT C C AG GAT C CAGGGGT C C C CAGGCT AAAGAAC AT GAT AC C GT GGC CAG C C A 420 

Qy 421 GTGACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAATGAGACACAGT GTTTCA 480 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GTGACAGAAAAAAGAGT GAATGTGCCTTTAAGAAGAAGAGCAATGAGACACAGTGTTTCA 480 

Qy 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I 1 I I I I I I I I I I I I I I I I 

Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 AGGACAAGGT CAT G GAG G GAAAAGG C CAAAG CC C CT TT GACC C C GCT CACAAGC AT AC GG 660 

Qy 661 CT GT CTT GGT GGAT GGGAT GCT CTAT T CT GGTACTAT GAACAACTT CCT GGGCAGT GAGC 720 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGAT GGGAT GCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

Qy 721 C CAT CCT GAT GC G C AC AC T GGGAT C C C AGCCT GT C CT C AAGAC C GAC AACT T CCTCCGCT 780 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I 

Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 



Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I I I I I I I ! I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I II I I I I I I I I 
Db 841 T CTT CGAG GAGAC AGC C AGCGAGT T T GACT T C T T T GAGAGGCT C CACAC AT CGCGGGT GG 900 

Qy 901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 901 CT AGAGT CT G CAAGAAT GAC GT G G GC GGCGAAAAGCT GCT GCAGAAGAAGT G GAC CAC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I M I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I 

Db 9 61 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 TT GAACGT GT CTT TAAGGGGAAATACAAAGAGTT GAACAAAGAAACTTCACGCT GGACTA 1200 

I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 TT GAAC GT GT CT T TAAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT GGACTA 1200 

Qy 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I II I I I I I I 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

Qy 12 61 AT AAGGCC CT GAC CT T CAT GAAGGAC CATTT C CT GAT GGAT GAGCAAGT GGT GGGGAC GC 1320 

I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1261 ATAAGGC C CT GAC CTT CAT GAAGGAC CATT T C CT GAT G GAT GAGCAAGT GGT GG GGAC GC 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 TT GAT GGGCAC AG C CAT CT T GT CAT GTAC CT GGGAAC CACCACAGGGT CGCT C C ACAAGG 1440 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I 
Db 1381 TT GAT GGGC ACAGC CAT CTT GT CAT GTACCT GGGAAC CAC CACAGGGT C G CT CC ACAAG G 144 0 

Qy 14 41 CT GT GGTAAGT GGG GACAGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCT GTT CC CT GAC C 1500 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1441 CT GT GGTAAGT GGGGAC AGC AGT GCT CAT CT GGT GGAAGAGAT T CAGCT GTT CCCT GACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

M I I I I I I I I I II I I I I I I I I I M II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 1561 CAGGAGGT GT CT GGAGGGT GC CCC GAGC CAACT GTAGT GT CTAT GAGAGCTGT GT GGACT 1620 



Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

Qy 1681 T GT C T GC C C C CAAC CT GAAC T C C T G GAAG CAGGACAT GGAGCGGGGGAAC C CAGAGT GGG 1740 

I I I 1 I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 18 61 T G GC CT CT TATT AT T GGAGT CAT GG C C C AGC AGCAGT C C CAGAAGC CT CT T C CACT GT CT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 18 61 T GGC CT CT TATT AT T GGAGT CAT G GC C C AGCAGCAGT C C CAGAAGC C T CTT C CACT GT CT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAACT GAGAAT GGCTTTT CATACCCT GTGAT CT C CTACT GGGT GGACAGCCAGGAC CAGA 204 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 19 81 CAACT GAGAAT G GCTT TT CAT AC C CT GT GAT CT CCTACT GGGT GGAC AG C C AGGAC CAGA 204 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I II I I I I I 1 I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I II I I I II 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I II I I II I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

Qy 2281 AGAAGG CC CC GT TAAGCAGAGAGCAAC AC CT C C AGT CT C C CAAGGAAT G CAGGACCT CT G 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 22 81 AGAAGG C C CC GT TAAGCAGAGAGCAAC AC CT CC AGT CT C CCAAGGAAT GC AGGAC CT CT G 234 0 

Qy 2341 C C AGT GAT GT GGAC GCT GACAACAACT GC CT AGGCACTGAG GT AGCT TAAACT CT AGG C A 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I 

Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 24 61 T GACTAGGAT GACAGCAGCACAAAAGACCACCTTT CT CC CCTGAGAGGAGCTT CT GCT AC 2520 



Db 



I II I I I I I I I I I I! I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2461 T GACTAGGAT GACAGCAGCACAAAAGACCACCTTTCT CCC CT GAGAGGAGCTT CT GCT AC 252 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2521 T CT GC AT C ACT GAT GAC AC T C AGC AG GGT GAT GCACAGC AGT CT GC CT C C C CT AT G G GAC 2 58 0 

I I I I I I I! I II I I I I I I I I I I I I I I I I I I II I 1 I I I I 1 I I I I I I I I I I I I I I II I II I I I 

2521 T CT GC AT C AC T GAT GAC ACT CAGCAGGGT GAT G CACAGCAGT CT GC CT C C CCT AT G G GAC 2580 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

2641 T ACACT GATATT GAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCATT CCAGGGACCCT C 2700 

I I I I I I I I I I I I I II I I I I I I II I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 T ACACT GATATT GAAGAACCT GGAGAGGAT CCTT CAGTT CT GGCCATTCCAGGGACC CT C 2700 

2701 C AGAAAC AC AGT GT T T CAAGAG AC C C T AAAAAAC CTGCCTGTCC C AG GAC C C TAT G GT AA 2760 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 CAGAAAC ACAGT GT T T CAAGAGAC C CTAAAAAAC CTGCCTGTCC CAGGAC C CT AT GGTAA 2760 

27 61 T GAACAC CAAACAT CT AAACAAT CAT AT GCT AACAT G CCACT C C T G GAAACT C CACT CT G 2 820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
2761 T GAACAC CAAACAT CT AAACAAT CAT AT GCTAACAT G CCACT C C T G GAAACT C CACT CT G 2 82 0 

2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 
2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

I I I I I I I I I I II II I I I II I I I I I I I I II II I I II I I I I I I I I I I I I I I I II I I I I I I I I 

2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I 

2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3 000 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I II I I I I I I II I 
3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 8 

US-10-006-818A-276 

Sequence 276, Application US/10006818A 
Publication No. US20030054406A1 
GENERAL INFORMATION: 
APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan 1. 



APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C4 

CURRENT APPLICATION NUMBER: US/ 10/ 006, 8 18A 
CURRENT FILING DATE: 2001-12-06 

Prior Application removed - See File Wrapper or Palm 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 276 
LENGTH: 3143 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-006-818A-276 



Query Match 100.0%; Score 3143; DB 15; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 3143; Conservative 0; Mismatches 



Length 3143; 
0; Indels 0; Gaps 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 



GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 
I I I I I I I I I I I I I I I I II I I t I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I 
GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 
I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | I I I I 
TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

CAGGG GAT GAAC GT AGGG CACTTAGCTT CTT CCAC CAGAAG GGC C T C CAGGATTT T GAC A 300 

I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I I I I II I I I I I 

C AGGGGAT GAAC GT AGGGCACT T AG CTT CT T C C AC CAGAAGGGCCT C CAGGAT T T T GACA 300 

CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

C CTT GGAT AT C CAG GAT C CAGG GGT C CC CAGGCT AAAGAAC AT GAT AC C GT GG C CAGC C A 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 42 0 



Qy 



421 



GT GAC AGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAG C AAT GAGAC AC AGT GT T T C A 4 80 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 



Db 


421 


GT GACAGAAAAAAGAGT GAAT GT GC CTTT AAGAAGAAGAGCAAT GAGAC ACAGT GTTTCA 


480 


Qy 


481 


ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 


540 






i i i M i i i i I i i i i i I i i i i i i i i i ii i i i I I i i i i i i i i i i i i i i i i i i i i i i i t i i i i 

1 i 1 1 I 1 1 1 1 1 1 1 1 1 1 1 J 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


481 


ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 


540 


Qy 


541 


CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 


600 






1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I i i I I 
• i i i i i i i t I i i i i i i i i i i 1 i i i i i i 1 I I ll I I l l l l l ll l l l l | M 1 1 | 1 1 1 | | | | | | 




Db 


541 


CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 


600 


Qy 


601 


AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 


660 






1 1 1 1 1 1 1 1 ! 1 I 1 1 1 M 1 i ! 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 I I 1 I 1 I I I [ I 
1 1 M 1 1 1 1 1 1 II 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 Ii 1 1 1 1 1 1 1 1 1 1 If 1 1 1 1 




Db 


601 


AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 


660 


Qy 


661 


CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 


720 






1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 i ! 1 1 i 1 1 1 1 1 i 1 I f t I l l I 1 l i i i i i 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 II I 1 II 1 1 I 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 M II II 1 1 1 1 1 | | 1 | j 




Db 


661 


CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 


720 


Qy 


721 


CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 


780 






1 1 1 1 1 1 1 1 If 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 I 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 II II 1 1 1 1 1 | | | | | I | | | | | | | | | {j |i | 




Db 


721 


CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 


780 


Qy 


781 


GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 


840 






1 1 I I I I I I 1 1 1 1 1 i 1 1 1 II 1 I 1 II 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 t t ! 1 1 1 I 1 1 1 t 1 ! t 1 1 1 1 I 
1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 II 1 1 II 1 1 1 1 II 1 1 1 II 1 1 1 II 1 1 M II 1 1 II 1 1 II II 1 1 1 1 1 




Db 


781 


GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 


840 


Qy 


841 


TCTT CGAGGAGACAGCCAGC GAGTTT GACTT CTTTGAGAGGCT CCACACAT CGCGGGT GG 


900 






1 1 1 1 1 1 1 1 1 l l 1 1 l l l l l l l I I 1 I I i I I I i I I I I i i i i i i i i t i i i i i i i i i i i i i i i i i 
l 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 II 1 1 1 1 1 1 1 1 1 I 




Db 


841 


TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 


900 


Qy 


901 


C T AGAGT CT G CAAGAAT GACGT GGGC GGC GAAAAGCT GCT GCAGAAGAAGT GGACCAC CT 


960 






1 i 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 ! M 1 1 1 1 i 1 1 1 1 I 1 1 1 
1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I I I I I I I 1 I I I I I i I | 




Db 


901 


CT AGAGT CT GCAAGAAT GAC GT GG GC GGC GAAAAGCT GCTG CAGAAGAAGT GGAC CAC CT 


960 


Qy 


961 


TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 


1020 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 | | 




Db 


961 


TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 


1020 


Qy 


1021 


ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 


1080 






1 1 1 1 1 1 1 1 1 1 1 M i 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 t 1 1 l l l M I i t I i t i i i I i i i 
l l l l l l l 1 l l l l 1 II 1 1 II 1 1 1 1 1 II i 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 II If 1 1 1 1 1 1 1 i 1 1 




Db 


1021 


ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 


1080 


Qy 


1081 


CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 


1140 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 i 1 M 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 I 1 1 || 1 1 | | | 1 1 1 1 




Db 


1081 


CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 


1140 


Qy 


1141 


T T GAAC GT GT CT TTAAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT GGACT A 


1200 






1 M 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 II 1 1 i 1 1 1 1 1 1 1 l 1 1 1 1 
i I i i i i i i i i ii i ii i if ii i ii i i i i i i i ii i i i i i i i i i i ii | | i i [ | | | | | | | | | | j 




Db 


1141 


T T GAAC GT GT CT T T AAGG GGAAAT AC AAAGAGT T GAACAAAGAAACT T CAC GCT G GAC T A 


1200 


Qy 


1201 


CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 


1260 






1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I I 1 II I I I | | | | 1 1 1 I 




Db 


1201 


CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 


1260 


Qy 


1261 


ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 


1320 






M 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 




Db 


1261 


AT AAG G C C C T GAC C T T CAT G AAG GAC CAT T T C C T GAT G GAT GAG C AAGT G GT G G G GAC G C 


1320 



Q y 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 138 0 

M I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I M | | | | | | | | I | | | | | | M | | | | | 

Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 TT GAT GG GCACAGC CAT CT T GT CAT GT AC C T GGGAAC C AC C ACAGGGT C G C T C CACAAGG 1440 

I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M | | | | | | | | | | | | | | | | | | | | 

Db 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

QY 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I 1 I M I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I | | | I I I I I I I I I I I I I I I I I 
Db 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I t I I I I I I I I I I I I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I | | | | | | | | M I I I I I II I I I I I I M I I 

Db 1561 CAGGAGGT GT CT GGAGGGT GCCCCGAGCCAACT GT AGT GT CTAT GAGAGCT GT GT GGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

I M I I I I I I I I I I I I II I I I I I I II I I I II I I I I I II I I I I I I I I II I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCC CAAC CT GAAC T C CT G GAAGC AGGAC AT GGAGC GGGGGAAC C CAGAGT GGG 1740 

I M I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 

Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I II 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | | | | | | | | | | 
Db 18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

QY 1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 2040 

I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1981 CAACT GAGAAT GGCTTTT CATACCCT GT GAT CT CCTACT GGGTGGACAGCCAGGACCAGA 2040 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Ill 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 



Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I ! I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 1 I I I I I I I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

Qy 2281 AGAAGGCCC C GTTAAGCAGAGAGCAACACCT CCAGT CT C C CAAGGAAT GCAGGACCT CT G 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 AGAAGGC C CC GT TAAGC AGAGAGCAAC AC CT CCAGT CT C C CAAGGAAT GC AG GAC CT C T G 234 0 

Qy 2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 

I I I I I I M I I I I I I I II I I I I I I II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 2341 C CAGT GAT GT GGACGCT GACAACAACT GCCT AGGCACT GAGGT AGCTTAAACT CT AGGCA 2400 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 24 61 T GAC TAGGAT GACAG C AGCACAAAAGAC CAC CTTTCTCCCCT GAGAGGAGCT T C T G CT AC 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 
Db 24 61 T GAC TAGGAT GACAGCAG CACAAAAGAC CAC CT TT CT C C C CTGAGAGGAG CT T CT GCT AC 2520 

Qy 2521 T CT G CAT CACT GAT GACACT CAGC AGGGT GAT GCACAGC AGT CT G CCT C C C CT AT GGGAC 2580 

I I I I I I I I I M I I I I II I I I I I II I I I I I I I I II I I I I I i I I I I I I I I I I I I I I I I I I I I 

Db 2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GATGCACAGCAGTCT GC CT CCCCTAT GGGAC 258 0 

Qy 2 581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

Qy 2641 T ACACT GAT ATT GAAGAAC CT GGAGAGGAT C CT T CAGTT CT GGCC AT T C CAGGGAC C CT C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2 641 T ACAC T GAT ATT GAAGAAC CT G GAGAGGAT C CT T CAGTT CT GG CC AT T C CAGGGAC C CT C 2700 

Qy 2701 CAGAAAC ACAGT GT TT CAAGAGAC C CTAAAAAAC CT GC CT GT C C CAGGAC C CT AT GGT AA 2760 

I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 2701 CAGAAACAC AGT GT TT CAAGAGAC C CT AAAAAACCT GC CT GT C CCAGGAC C C TAT GGTAA 2760 

Qy 2761 T GAAC ACCAAACAT CT AAACAAT CAT AT GCT AACAT G CC AC T C CT GGAAACT C CACT CT G 2820 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2761 T GAACAC CAAACAT CTAAACAAT CAT AT GC TAAC AT GC C ACT C CT GGAAAC T C C ACT CT G 2820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I II I I II I I I I II I I I I I 

Db 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2 88 0 

Qy 28 81 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

Qy 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I I I I I I I I II 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 



Db 



II I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II M | | I | | | | | | | 

3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 



Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I t II I I I I I I I II I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATAT AAGGCT TAAAAAAA 3143 

I I I I I I I I I I I II I II I I I I I I I 
Db 3121 TAAAAATATAAGGCT TAAAAAAA 3143 
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0; 



Qy 

Db 



1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 



Qy 

Db 

Qy 



61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I M I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I II I I I I I I I I I II I I I I 
61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 



I I I I I I I I I I I I i I I ! I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I I I I I I I I I I li I i I I I I I I I I I I I I I I I I II I I I I I I I I I I I I | | | | | | | | | | I | I I I 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

II I I I I I I I I I I i I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 3 60 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 3 01 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 C CT T G GAT AT C C AGGAT CCAGGG GT C C C CAGG CT AAAGAAC ATGAT AC C GT GGCC AGC C A 420 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 
Db 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 420 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 421 GT GACAGAAAAAAGAGT GAAT GT GC CTT TAAGAAGAAGAGCAAT GAGAC AC AGT GT T T C A 480 

Qy 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTC7VAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I II I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 1 I II I I I II I I I I I I I I I I I I I 

Db 601 AGGACAAGGT CAT GGAGGGAAAAGG C CAAAG C C C CTT T GACC CC GCT CACAAG CATAC GG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 72 0 

Qy 721 C CAT C CT GAT G C GC ACACT G G GAT C C C AGC CT GT C CT CAAGAC C GAC AACT TCCTCCGCT 780 

I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 

Db 841 T CTT C GAGGAGAC AGC CAG C GAGT TT GAC T T CT TT GAGAGGCT C CAC AC AT CGCGGGTGG 900 

Qy 901 CT AGAGT CT GCAAGAAT GACGT GGGC GGCGAAAAGCT GCT GCAGAAGAAGT GGACCAC CT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CTAGAGTCT GCAAGAAT GACGT GGGC GGCGAAAAGCT GCT GCAGAAGAAGT GGACCACCT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 



Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 T T GAAC GT GT C T T T AAG G G GAAAT AC AAAGAGT T GAACAAAGAAACT T CAC G CT GG ACT A 1200 

I I I I I I II I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T T GAAC GT GT CT T TAAGGGGAAAT ACAAAGAGT T GAA.CAAAGAAACT T CAC GCT GGACT A 1200 

Qy 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

I I M I I I I I I I I I I I I I I I I I I | I I I I I M I I i I I I I I I || I I I I I I I I I I I | I | | | | | | 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 12 61 ATAAGGCCCT GACCTT CAT GAAGGACCATTT CCTGAT GGAT GAGCAAGTGGT GGGGACGC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I 
Db 1261 AT AAGGCC CT GACCTT CAT GAAGGACCATTT CCTGAT GGAT GAGCAAGT GGT GGGGACGC 1320 

Qy 1321 C C CTGCT GGT GAAAT CT GGC GT GGAGTATACAC GGCTT GCAGT GGAGACAGC CCAGGGCC 1380 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1321 C C CT GC T G GT GAAAT C T GGC GT G GAGT AT AC AC GGCT T GCAGT G GAGAC AG C CCAGGGCC 1380 

Qy 1381 T T GAT GG GCACAGC CAT CT T GT CAT GT AC CT G GGAAC CAC C AC AGGGT C G CT C CAC AAGG 144 0 

I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I | 
Db 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

Qy 1441 CT GT GGTAAGT G GGGACAGC AGT GCT CAT CT GGT GGAAGAGAT T CAGCT GTT C C CT GAC C 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I II I I I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGT GT CT GGAGGGT GCCCCGAGC CAACTGTAGT GT CTAT GAGAGCT GT GT GGACT 1620 

I I I I I II I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CAGGAGGT GT CT GGAGGGT GCC C C GAGC CAACT GTAGT GT C TAT GAGAGC T GT GT G GACT 162 0 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 T GT CTGCCCCCAACCT GAACTCCTGGAAGCAGGACAT GGAGCGGGGGAACC CAGAGT GGG 1740 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CAT GT G C C AGT G GC C C CAT GAGCAG GAGC CT T C GG CCT CAGAG C C GC CC GCAAAT CAT T A 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I M M I I I I I II I I I I I I M I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I II 

Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 



Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I II I I I I I I I I M I I I I I I I I I I I I I II I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

Qy 1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 2040 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 CAAC T GAGAAT GGCT TT T CAT AC CCT GT GAT CT C CT ACT GGGT G GAC AGC C AGGAC CAGA 2040 

Qy 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

Qy 2281 AGAAGGCC CCGTTAAGCAGAGAGCAACACCTCCAGT CT CC CAAGGAAT GCAGGAC CT CT G 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 81 AGAAGGC C C C GT TAAGCAGAGAGCAAC AC C T C CAGT CT CC CAAGGAAT GCAGGAC CT CT G 234 0 

Qy 2341 C CAGT GAT GT GGACG CT GACAACAACT GCCT AGGCACT GAGGTAGCT T AAACT CT AGGC A 24 00 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 C CAGT GAT GT G GAC GCT GACAACAAC T G C CTAG GCACT GAGGT AGC T TAAACT CT AGGC A 2400 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 2461 T GAC T AGGAT GAC AGCAG C ACAAAAGAC CAC CT T TCTCCCCT GAGAG GAGC T T CT GC T AC 2520 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 ii 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 r i ii 1 1 1 1 1 1 1 1 1 1 ii 

Db 2461 T GACTAGGATGACAGCAGCACAAAAGACCACCTTTCTC CCCT GAGAGGAGCTT CT GCTAC 2520 

Qy 2521 T CT GCAT CACT GAT GACACT CAGCAGGGTGATGCACAGCAGT CT GC CT CC CCTAT GGGAC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I M I I I I I I I I I I 

Db 2521 T CT GCAT CACT GAT GAC AC T CAGC AG GGT GAT GCACAG CAGT C T GC CT C CC CT AT GGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCT7^ACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 640 

Qy 2641 TACACT GAT ATT GAAGAAC CT GGAGAGGAT C CTT CAGT T CT GGCCATT C CAGGGAC CCT C 2700 

I I M I I I I I I I I I I I II I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 TACACT GATAT T GAAGAAC CT GGAGAGGAT CCTT CAGTT CT GGCCATT CCAGGGACC CT C 2700 



Qy 

Db 



27 01 CAGAAAC ACAGT GT T T CAAGAGAC C C TAAAAAAC CTGCCTGTCC CAGGAC C CT AT GGTAA 27 60 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 C AGAAACAC AGT GT T T CAAGAGAC C CT AAAAAAC CT G C CT GT C C CAGGAC C CT AT GGTAA 2760 



Qy 2761 T GAAC AC CAAAC AT CTAAACAAT CAT AT G CT AAC AT G C C ACT C CT GGAAACT C C ACT CT G 2820 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I I I | i | | I 
Db 2761 T GAAC AC CAAAC AT CTAAACAAT CAT AT GC TAACAT GCCACT C CT G GAAACT C C ACT CT G 2820 

Qy 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 1 I I I I I I I I I I I I I I I I 
Db 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I 
Db 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I II I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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Qy 1 GGGCTGAGGCACT GAGAGAC CGGAAAGCCTGGCATT C CAGAGGGAGGGAAACGCAGCGGC 60 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I i I I i I I | | | | | | 
Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I ! I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 1 1 I I I I I I I I I I 1 I I I I I I 1 I i I I I I 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 C AGG GGAT GAACGT AGGGCACT T AGCT T C T T C CAC C AGAAGGGC CT C CAG GAT TT T GACA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTT GGATAT CCAGGAT CCAGGGGT CC CCAGGCTAAAGAACATGATACCGT GGCCAGCCA 42 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 361 CCTT GGATAT C C AGGAT C C AGGGGT C C C CAG G CT AAAGAAC AT GAT AC C GT GGCC AGC CA 42 0 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT G CCTT T AAGAAGAAG AGC AAT GAGAC AC AGT GT T T C A 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
Db 421 GT GAC AGAAAAAAGAGT GAAT GT G C C T T T AAGAAGAAG AG C AAT GAG AC AC AGT GT T T C A 480 

Qy 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I 

Db 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGT CAT GGAGGGAAAAGGCCAAAGCCCCTTTGAC CC C GCTCACAAGCATAC GG 660 

I I I I I I I I I I I I I I I I I I I I I I I I i I I I II II I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 601 AGGACAAGGT CAT GGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 



Db 661 CT GT CT T GGT GGAT G GGAT GCT CT ATT CT GGT ACTAT GAACAACTT C C T G GG C AGT GAGC 720 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

Qy 7 81 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

Qy 841 T CTTCGAGGAGACAGCCAGCGAGTTT GACTT CTTT GAGAGGCT CCACACATCGCGGGT GG 900 

I I I I I I I II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

Qy 9 01 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

I I I I I I II II I I I I 11 I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 901 CT AGAGT CT GCAAGAAT GAC GT GGGC GGC GAAAAGCT GCT GCAGAAGAAGT G GACCAC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I 

Db 9 61 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I 

Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

Qy 1141 T T GAAC GT GT CT T T AAG GGGAAAT AC AAAGAGT T GAACAAAGAAACT T C AC GCT GGAC T A 12 00 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I 11 II I I II I I I I I I I I I I II I I I I I I I I I I I 
Db 1141 T T GAAC GT GT CT TTAAGG GGAAAT ACAAAGAGT T GAACAAAGAAACT T C AC GCT GGACT A 120 0 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 

Db 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

Qy 1261 ATAAGGCCCT GACCTT CATGAAGGACCATTTCCT GAT GGAT GAGCAAGT GGT GGGGACGC 1320 

I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I 1 I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 T T GAT G G G C AC AG C CAT C T T GT CAT GT AC C T G G GAAC C AC C AC AG GGTCGCTC C AC AAG G 1440 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13 81 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

Qy 1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT CAGCT GTT CC CT GAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 



Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGT GT CT GGAGGGT GC CCCGAGC CAACT GTAGT GT CTAT GAGAGCT GT GT GGACT 1620 

I I 1 I I 1 I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 1 I 1 I I I I I I I I I I I I 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

1 I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I I I I I I I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 T GTCT GC C CC CAAC CT GAACT C CT GGAAGC AGGACAT GGAG C GGG GGAAC C C AGAGT GGG 174 0 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 T GT C T GC C CC CAAC CT GAACT C CT GGAAGC AGGACAT GGAGCG GG GGAAC C C AGAGT G GG 1740 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 1861 T GGC CT CT TAT T ATT GGAGT C AT GGC CC AGCAGC AGT C C CAGAAG C CT CT T C CACT GT CT 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

Qy 1981 CAACT GAGAAT GGCT TT T CAT AC C CT GT GAT CT C CTACT GGGT GGACAGC C AGGAC C AGA 204 0 

I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1981 CAACT GAGAAT GGCT TT T CAT AC C CT GT GAT CT C CTACT GG GT GGACAGC CAGGACCAGA 204 0 

Qy 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 

Db 2 041 CCCT GGC CCTGGATCCT GAACT GGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAGGCCCCGT T AAGCAGAGAGCAACAC CT CCAGT CT C CCAAGGAAT GCAGGAC CT CT G 234 0 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 AGAAGGC C C C GT T AAGC AGAGAGCAACACCT C C AGT CT C C C AAGGAAT GCAG GACCT CT G 234 0 

Qy 2341 CCAGT GAT GT G GAC GCT GACAACAAC T G CCTAGGCAC T GAGGT AGCT T AAACT CT AG GC A 2400 

I I It I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I II 
Db 2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 



Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I II I i I I I I I I I II I I I I I I I I I | | | | 

Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 2461 T GAC T AGGAT GACAGC AGC ACAAAAGAC CAC CT TT CT C C C CT GAGAG GAGCT T CT G CT AC 2520 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 
Db 2461 T GACT AGGAT GAC AGC AG CACAAAAGAC CAC CT TT CT C C C CT GAGAGGAGC T T CT GCT AC 2520 

Qy 2521 T C T G CAT CAC T GAT GAC AC T C AG C AG G GT GAT G CAC AG C AGT CTGCCTCCCC TAT G G GAC 2580 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 I I I I I I I | | I I 
Db 2521 TCTGCATCACTGATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGAC 2 58 0 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

Qy 2641 TACACT GATATT GAAGAAC CT GGAGAGGAT C CTT CAGTT CT GGCC ATT C CAGGGACCCT C 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2641 TACACT GAT ATT GAAGAAC CT GGAGAG GAT C CT T CAGT T CT GG C CAT T C C AGGGAC C CT C 27 00 

Qy 2701 C AGAAACACAGT GT T T CAAGAGAC C CTAAAAAAC CTGCCT GT C CC AGGAC C CT AT GGTAA 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 01 C AGAAACACAGT GT TT CAAGAGAC C CTAAAAAACCT G C C T GT C CCAGGAC C CT AT GGTAA 2 760 

Qy 2761 T GAAC AC CAAACAT CT AAACAAT CAT AT GCT AACATGCCACT C CT GGAAACT C CACT C T G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 27 61 T GAAC AC CAAACAT CTAAACAAT CAT AT GCTAACAT GC CACT CCT G GAAAC T C C ACT CT G 2 82 0 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 94 0 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I 1 I I I I I I I I I I 1 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 



RESULT 11 

US-10-012-121A-276 

; Sequence 276, Application US/10012121A 
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Query Match 100.0%; Score 3143; DB 15; Length 3143; 
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Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

GGGCT GAGGCACTGAGAGACCGGAAA.GCCT GGCATTCCAGAGGGAGGGAAAC GCAGC GGC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
GG GCT GAG G C ACT GAGAGAC C GGAAAGC CT GGCAT T C CAGAGGGAGG GAAAC GCAGC G GC 6 0 

ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I 
ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 
I I I M I M I I I I I i I I I I I I I I I I I I I I I II I i I I I I I I I I II I I I I I I I I I I i I I I I I I 
TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 2 40 

C AGG GGAT GAAC GT AGGGCAC T T AGCTT CTT C C AC CAGAAG GG CCT C CAGGAT T T T GAC A 300 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

CAGGG GAT GAAC GTAGGG CACT T AGCT T CT T CC AC CAGAAGG GCC T C C AGGATT T T GAC A 300 

CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 



QY 361 C C T T G GAT AT C C AGGAT CCAGGG GT C C C CAG G C TAAAGAAC AT GAT AC C GT GGC CAGC C A 420 

M I I I I I I I I I I I I I I I | | | | | | | | | I | | | | | I I | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 361 C C TT G GAT AT C C AGGAT CCAG GGGT C C C CAG G C TAAAGAAC AT GAT AC C GT GGC CAGC C A 42 0 

QY 421 GT GACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT GAGACACAGT GTTT CA 4 80 

I I I I M I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I II I I I I I I I I II I I 

Db 421 GT GACAGAAAAAA.GAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGACACAGT GT T T C A 480 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I M M I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I | | | | | 
Db 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I M I II I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I II I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CT GT CTT GGT GGAT GGGAT GCT CTATT CT GGTACT AT GAACAACTT CCT GGGCAGT GAGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 661 CT GT CT T GGT GGAT GGGAT GCT CT ATT CT GGT ACT AT GAACAAC T T C C T GGGCAGT GAGC 720 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

M I i I M I I I M I I I M I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I 
Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I I I I I M M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 841 T CT T CGAGGAGACAGC CAGC GAGTT T GACTT CTT T GAGAGGCT C C AC AC AT C GC GG GT GG 900 

Qy 9 01 C T AGAGT CT GCAAGAAT GAC GT GGGC G GC GAAAAG CT GCT G C AGAAGAAGT G GACCAC CT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I 
Db 901 CT AGAGT CT G CAAGAAT GAC GT GG GC GGC GAAAAGCT GCT G CAGAAGAAGT GGAC CAC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I M I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | | | M I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 T T GAAC GT GT CT TTAAGGGGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GC T G GACT A 12 00 

I I I I I I I M I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I | | | | I I I I 
Db 1141 T T GAAC GT GT CTTTAAGG GGAAAT ACAAAGAGT T GAACAAAGAAACT T CAC GCT G GAC T A 1200 

Qy 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 I I I I I I I I I I 1 1 I I I I I i I II I I I I II I II I 1 1 I I 1 1 I I I I II I I I M i I I I I l l l l l 

1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

1261 AT AA G G C C C T G AC C T T CAT G AAG G A C CAT T T C C T GAT G GAT GAG C AAG T G G T G G G G AC G C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1261 AT AAGGCC CT GAC CT T CAT GAAG GACC AT TT C CT GAT G GAT GAGC AAGT GGT GGGGAC GC 1320 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I M I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 138 0 

1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 144 0 

I I I I I I I I I I I I M I I II I I II I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 TT GAT G GGCACAGC C AT CT T GT CAT GT AC CT GGGAAC CAC CAC AGG GT C G CT C C ACAAGG 1440 

14 41 CT GT GGTAAGT GGGGACAGCAGTGCT CAT CT GGT GGAAGAGATT CAGCT GTT CC CT GACC 1500 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
1441 CT GT GGTAAGT GGGGAC AGCAGT GCTCAT CT GGT GGAAGAGATT CAGCT GTT CCCT GACC 1500 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 C AG GAG GT GT C T GG AG GGTGCCCC GAG C C AACT GT AGT GT C TAT G AGAG C T GT GT G GACT 1620 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 
1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

1741 CAT GT GCC AGT GGC CC CAT GAGCAGGAGC CT T C GGCC T C AGAGCC GC C C GCAAAT CATT A 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

1741 CAT GT GC C AGT GGC CC C AT GAG C AGGAGC C T T C GGC CT C AGAG C C GC C C GCAAAT CAT T A 1800 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II I I 
18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 192 0 

I It I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

18 61 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

1981 CAACT GAGAAT GGCTTTT CATACCCT GTGATCT CCTACT GGGT GGACAGCCAGGAC CAGA 2040 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 
1981 CAACT GAGAATGGCTTTT CAT ACC CT GT GAT CT CCTACT GGGT GGACAGCCAGGAC CAGA 2 040 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 
I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



Db 


2041 


Qy 


2101 


Db 


2101 


Qy 


2161 


Db 


2161 


Qy 


2221 


Db 


2221 


Qy 


2281 


Db 


2281 


Qy 


2341 


Db 


2341 


Qy 


2401 


Db 


2401 


Qy 


2461 


Db 


2461 


Qy 


2521 


Db 


2521 


Qy 


2581 


Db 


2581 


Qy 


2641 


Db 


2641 


Qy 


2701 


Db 


2701 


Qy 


2761 


Db 


2761 


Qy 


2821 


Db 


2821 


Qy 


2881 


Db 


2881 



2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 
CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I M M M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I It I I I I I I I I I I t I I I I I II I 

CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGT CT CCCAAGGAAT GCAGGAC CT CT G 234 0 
I M I I I I I I I I II I I I I I I I I I I I I || I I | | | | i | | | | | | | | | | | | | | | | | | | | | | | | | | 
AGAAG GC C C C GT T AAGC AGAGAG CAAC AC C T C C AGT CT CC CAAGGAAT GCAG GAC CT C T G 234 0 

CCAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT GAGGTAGCTTAAACTCTAGGCA 24 00 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCAGT GAT GT GGACGCT GACAACAACT GCCTAGGCACT GAGGTAGCTTAAACT CTAGGCA 24 00 

CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 252 0 

I I I I I I I I M I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
T GACT AGGAT GACAGCAGC ACAAAAGAC CAC CTT T CT C C C CT GAGAGGAGCT T CT GC T AC 252 0 

T CT G CAT CACT GAT GACACT CAGC AGG GT GAT GCAC AGCAGT CTGC CT C C C CT AT G G GAC 258 0 
I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I || I I I I I I I I | | | | | | | | | | M 
T C T GC AT CACT GAT GACAC T C AG C AGG GT GAT GCAC AGCAGT CT GC CT C C CCT AT G GGAC 25 80 

TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 
TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

T ACACT GAT ATT GAAGAAC CT GGAGAGGAT CCTT CAGT T CT GGC CAT T C CAGG GACC CT C 27 00 
M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I | 
T AC AC T GAT AT T GAAGAAC C T G GAGAG GAT CCTT C AG T T C T G G C CAT T C C A G G GAC C C T C 2700 

C AGAAAC AC AGT G T T T C AAG AGAC C C T AAAAAAC CTGCCTGTCC C AG GAC C C TAT G GT AA 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C AGAAAC AC AGT GT T T C AAG AG AC C C T AAAAAAC CTGCCTGTCC C AG GAC C C TAT G GT AA 2760 

T GAAC AC CAAAC AT CTAAACAAT CAT AT GCTAACAT GC CACT C CTGGAAACT C CACT CT G 2820 

I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T GAAC AC CAAAC AT C TAAACAAT CAT AT GCTAACAT GC C ACT C CT GGAAAC T C CACT CT G 2820 

AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 
I I I I M I I I I I I I I I I I I I II I I I I I I I I II I I II II I I II I I I I I I I II I I I I I I I I I I 
AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 



Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAG7^TGG 3000 

I I I I M 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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Query Match 100.0%; Score 3143; DB 15; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
Qy 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 

I II I I I I I 1 1 1 1 1 1 I I I I II I I I I I I 1 1 I 1 1 I I 1 1 1 1 1 I I I I 1 1 1 i I I I I I I I 1 1 I 1 1 I I 

Db 1 GGGCTGAGGCACTGAGAGACCGGAAAGCCTGGCATTCCAGAGGGAGGGAAACGCAGCGGC 60 



Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I I I I I I I I I I I I I II I I i I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I II I i 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

I I II I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I II I I I I I I I 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I 

Db 241 C AG G G GAT GAAC GT AGG G C AC T TAG C T T CT T C CAC C AGAAGGG C CT C C AG GAT T T T GAC A 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 3 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I i I I 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 42 0 

I I I I I I I I I I I I II I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 361 C CT T GGAT AT C CAGGAT C CAGGG GT C C C C AGGCTAAAGAAC AT GAT AC C GT G G C C AG C CA 42 0 

Qy 421 GT G AC AGAAAAAAGAGT GAAT GT G C C T T T AAGAAGAAGAG CAAT GAG AC AC AGT GT T T C A 48 0 

I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I 

Db 421 GT GAC AGAAAAAAGAGT GAAT GT GC CT T TAAGAAGAAGAGCAAT GAGAC AC AGT GT TT C A 480 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I II 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AGGACAAGGT CAT GGAG G GAAAAG G C C AAAGC C C CT TT GACC C C GCT CACAAGC AT AC GG 660 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 721 C CAT C CT GAT GC GCACACT GGGAT C C C AGC CT GT C CT C AAGAC C GACAAC TTCCTCCGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

I I M I I M I I I I I I I I I I I I I II I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

I I I I I I I I I I II I I I I I I II I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 841 T C T T C GAGGAGACAGCC AGC GAGT T T GAC T T CTT T GAGAGGCT C CAC ACAT CGCGGGTGG 900 



Qy 901 CT AGAGT C T G CAAGAAT GAC GTGGGCGGC GAAAAGCT G CT GC AGAAGAAGT GGAC CAC CT 960 

I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | M I I I I I I I I I I I 
Db 901 CT AGAGT CT GCAAGAAT GACGT G GGC G G C GAAAAG CT GCT GCAGAAGAAGT G GAC CAC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I I M I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I | | I I i | | | | 
Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

Qy 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 TT GAAC GT GT CTT TAAGGGGAAAT ACAAAGAGT T GAACAAAGAAACTT C ACGCT G GACT A 1200 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T T GAAC GT GT C TT TAAG G GGAAAT ACAAAGAGT T GAACAAAGAAAC T T CAC G CT G GAC T A 12 00 

Qy 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I || I I M | | | 
Db 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

Qy 12 61 AT AAGGCC CT GAC CT T CAT GAAGGAC CATT TC CT GAT GGAT GAG CAAGT GGT GGGGACGC 1320 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I 
Db 12 61 ATAAG GC CCT GAC CT T CAT GAAGGAC CAT T T C CT GAT GGAT GAGCAAGT GGT G GGGAC G C 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 T T GAT G G GCAC AGCCAT C T T GT CAT GT AC CT GGGAACCAC CACAGG GT C GC T C CACAAG G 1440 

I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 

Db 1381 TT GAT GGGCACAGCCAT CTT GTCAT GT AC CT GGGAACCAC CACAGGGT C GCT C CACAAG G 1440 

Qy 1441 CT GT GGTAAGT GGGGAC AGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCT GT T C C CT GAC C 1500 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1441 CT GT G GT AAGT GGG GACAGC AGT GCT CAT CT GGT GGAAGAGAT T CAG CT GT T C C C T GAC C 1500 

Qy 15 01 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAG GAGGT GT CT G GAGG GT GC CCC GAGC CAACT GT AGT GT CT AT GAGAGCT GT GT GGAC T 1620 

I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

M I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 174 0 

I ! I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 T GT CT GCCC CCAACCT GAACT C CT GGAAGCAGGACAT GGAGC GGGGGAACCCAGAGT GGG 174 0 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 



Db 1741 CAT GT GC C AGT GGCC C CAT GAGC AGGAGC C TTCGGCCT CAGAGC CGCC C GCAAAT CAT T A 18 00 

Qy 18 01 AAGAAGTCCTGGCTGTCCCC7^ACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I II 
Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 19 80 

Qy 1981 CAACT GAGAAT GGCTTTTCAT ACC CT GT GAT CT C CT ACT GGGT GGACAGCCAGGACCAGA 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1981 CAAC T GAGAAT GGCT TT T CAT AC C CT GT GAT CT C CT ACT G GGT G GACAG C CAG GAC C AGA 204 0 

Qy 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I I I I I I I i I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 228 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 

Qy 2281 AGAAGGCCC CGTTAAGCAGAGAGCAACACCTCCAGT CT CC CAAGGAAT GCAGGACCT CT G 234 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 AGAAGGC C C C GTTAAGC AGAGAG CAAC AC CT C CAGT CT C C CAAGGAAT G CAG GAC CT CT G 2340 

Qy 2341 C CAGT GAT GT G GAC G CT GAC AACAACT G CCTAGGCACT GAGGT AGCT T AAACT CT AGGC A 2400 

I I I I I I I I I I I I I I I I I I I I II I 1 I I II I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 
Db 2 341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 

Qy 2 4 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I II I I 

Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 24 61 T GACT AG GAT GACAG C AGC ACAAAAGAC CACCTTT CT C C CCT GAGAGGAGCTT CT GCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 T GAC T AGGAT GACAG CAG C ACAAAAGAC CAC CTT T CT C CC CT GAGAGGAGCT T CT GCTAC 252 0 

Qy 2521 T CT GC AT C ACT GAT GAC ACT CAG CAGGGT GAT GCACAGCAGT CT GC C T C C C CT AT GGGAC 2580 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I 
Db 2521 T CT GCAT C ACT GAT G ACAC T C AGCAG G GT GAT GCACAG CAGT CTGCCTCC C CT AT GGGAC 258 0 



Qy 



2581 T C C CT T CT ACCAAG CAC AT GAGCT CT C TAACAGGGT GG GG GC T AC C C C C AGAC CT GC T C C 2640 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 



Db 



2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 



Qy 


2641 


T AC ACT GAT AT T GAAGAAC CT GGAGAGGAT C CT T CAGT T CT GGC CAT T C CAGGGAC C CT C 
1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 I I I I M | | | | | | | | | | 

T AC ACT GAT AT T GAAGAAC CT GGAGAG GAT CCTT CAGTT CT G GC CAT T C CAGGGAC C C T C 


2700 


Db 


2641 


2700 


Qy 

Db 


2701 
2701 


CAGAAAC AC AGT GT T T C AAGAGAC C C T AAAAAAC CTGCCTGTCC C AG GAC C CT AT GGT AA 

1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I | 1 1 1 1 1 1 1 II 1 1 1 

CAGAAAC AC AGT GTT T CAAGAGAC C CT AAAAAAC C T GC CT GT CC CAGGAC CC T AT GGT AA 


2760 
2760 


Qy 


2761 


T GAAC AC CAAACATCTAAACAAT CAT AT GCTAAC AT GC CACT C CT G GAAACT C C ACT CT G 

1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | 1 1 1 1 1 1 1 1 
T GAAC AC CAAAC AT C TAAACAAT CAT AT GCTAAC AT GC CACT C CT G GAAACT C CACT CT G 


2820 


Db 


2761 


2820 


Qy 


2821 


AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 
1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 || M 1 1 1 1 1 II 1 1 1 I I || 1 II 1 1 1 1 1 
AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 


2880 


Db 


2821 


2880 


Qy 


2881 


TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 
M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | | | | | | | | | 
TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 


2940 


Db 


2881 


2940 


Qy 


2941 


CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 


3000 


Db 


2941 


3000 


Qy 


3001 


CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 
M 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | | | | | | | | | | 

CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 


3060 


Db 


3001 


3060 


Qy 

Db 


3061 
3061 


TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 


3120 
3120 


Qy 


3121 


TAAAAATATAAGGCTTAAAAAAA 314 3 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TAAAAATATAAGGCTTAAAAAAA. 3143 




Db 


3121 





RESULT 13 

US-10-006-117A-276 

Sequence 276, Application US/10006117A 
Publication No. US20030082627A1 
GENERAL INFORMATION: 
APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan 1. 
APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 



APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C13 

CURRENT APPLICATION NUMBER: US/1 0/ 006, 1 17A 
CURRENT FILING DATE: 2002-03-19 

Prior Application removed - See File Wrapper or Palm 
PRIOR FILING DATE: 2001-07-09 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 276 
LENGTH: 3143 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-006-117A-276 

Query Match 100.0%; Score 3143; DB 15; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 G G G C T GAGGCACT GAGAGAC C GGAAAGCCT GGCATT CCAGAGGGAGGGAAAC GC AGC G GC 60 

I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I II 
Db 1 GGGCT GAG G C ACT GAGAGAC C GGAAAG C CT GGCATT C C AGAG GGAG GGAAAC GC AGC GGC 60 

Qy 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I II I I I I i I I I I I 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I II I I I I I I I I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I I 
Db 181 T GC C GAC GAC GAC C G CG GGGGGAG G C GGG C AGGGGC C CAT GC C C AGG GT C AGAT ACT AT G 24 0 

Qy 241 CAGGGGAT GAACGT AGGGCACTT AGCTT CT T C CACCAGAAGGGC CT C C AGGAT T T T GAC A 300 

I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CAG GGGAT GAACGT AGGGCACT TAG C T T CTT C CAC C AGAAGGGC CT C C AG GAT T T T GAC A 300 

Qy 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 361 CCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 C CT T G GAT AT C CAGGAT C CAGGGGT C C C CAGGCT AAAGAACAT GAT AC C GT GG C C AGC C A 420 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT G C C TT T AAGAAGAAGAG CAAT GAGAC AC AGT GT T T C A 4 80 

I I I I I I I I I I I I I I I I I 1 I II I I I I I I I I I I I I I I 1 I I I I I I I I I I i I I I I I I I I I I I I I 
Db 421 GT GAC AGAAAAAAGAGT GAAT GT GC CT TT AAGAAGAAGAG CAAT GAGAC AC AGT GTT T CA 480 

Qy 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 



Qy 



541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I 



Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 


Db 


841 


Qy 


901 


Db 


901 


Qy 


961 


Db 


961 


Qy 


1021 


Db 


1021 


Qy 


1081 


Db 


1081 


Qy 


1141 


Db 


1141 


Qy 


1201 


Db 


1201 


Qy 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 



CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

AGGACAAGGT CAT GGAGGGAAAAGGC CAAAGCCC CTT T GAC CCCGCT CACAAGCAT AC GG 660 
I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AG GAC AAGGT CAT GGAG G GAAAAG GC CAAAGC CC CT TT GACC C C GCT CACAAGCAT AC G G 660 

CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I | I I I I I I I I I I I I 
CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

C CAT C CT GAT GC GC ACACT GGGAT C C C AG C C T GT C C T CAAGAC C GACAACT TCCTCCGCT 780 

M I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I | | | | | | | | | || | | | | | | | | | | | | | 

CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 7 8 0 

GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 
I I M I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | M 
GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

TCTT CGAGGAGACAGCCAGCGAGTTT GACTTCTTTGAGAGGCT CCACACAT CGCGGGT GG 900 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I I I 

T CT T C GAGGAGAC AGC CAGC GAGT T T GACT T C TT TGAGAGG CT CCACACAT CGCGGGT GG 900 

CT AGAGT CT GCAAGAAT GACGTGGGC G GC GAAAAGCT GCT GCAGAAGAAGT G GAC C AC CT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
CT AGAGT CT GCAAGAAT GACGT GGGC GGCGAAAAGCT G CT GCAGAAGAAGT GGACC AC CT 960 

TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 
I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I | | | | | | | 
ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

TT GAACGT GT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACTA 12 00 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I I I 
TT GAACGT GT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACTA 12 00 

CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I | | I I | I I I | | 

CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

AT AAGGCC CT GAC CT T CAT GAAGGAC CATTT C CT GAT GGAT GAGCAAGT GGT GGGGAC GC 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | I I I I I I I I I I 

ATAAGGC C CT GAC CT T CAT GAAGGAC CATT T C CT GAT GGAT GAGCAAGT GGT GGGGAC GC 1320 

CC CT GCT GGT GAAAT CT GGCGT GGAGTAT ACACGGCT T GCAGT GGAGACAGCCCAGGGC C 1380 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 138 0 

TT GAT GGGCACAGCCAT CTT GT CAT GTACCT GGGAAC CACCACAGGGT CGCT CCACAAGG 1440 
I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 



Qy 


1441 


C T GT GGTAAGT GGG GAC AG C AGT GC T CAT C T G GT G GAAGAGAT T C AGCT GT T C CCT GAC C 1500 

M 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 I I I II 1 | | | | I | 1.1 I I I I M 1 1 1 1 1 II 1 | | | M 1 1 1 1 1 1 II 1 

CTGT GGTAAGT GGGGAC AGC AGT GC T C AT CT G GT G GAAGAGAT T C AGCT GT T C CCT GAC C 1500 


Db 


1441 


Qy 


1501 


CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 I | | || | | | I I I I I I | | | | | || | | | | | | | | | | | | | | | | 

CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 


Db 


1501 


Qy 


1561 


CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGA^Af^rTTTrTrr apt 1 £?n 
1 1 M M 1 II 1 1 M 1 1 1 1 II 1 1 1 1 1 | | | | | | | | | || | | | | | | | | | | || || | | | | | | | | | | | 
CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 162 0 


Db 


1561 


Qy 


1621 


GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAArrTrTTrrrTrr 1 £«n 

1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I | | | | | | | | | | | | | 

GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 168 0 


Db 


1621 


Qy 


1681 


TGTCTGCCCCCAACCTG7VACTCCTGGAAGCAGGACATGGAGCGGGG(^AArrrA^ArTrrr 11 An 

1 M 1 1 1 1 II 1 1 1 1 1 1 1 I I I I I | I | | | | | | | | | | || | | | | || | | | | | | | | | | | | | | | | | | | 

TGT CT GCCCCCAAC CT GAACT CCTGGAAGCAGGACAT GGAGCGGGGGAACCCAGAGT GGG 174 0 


Db 


1681 


Qy 


1741 


CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCC Grrrnr A AATP ATT a i ftnn 

1 1 J 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I || I I | | | | | M 1 II 1 1 1 

CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 


Db 


1741 


Qy 


1801 


AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCC CCC ACrTGTC&fcrrT iPfin 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 

AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 18 60 


Db 


1801 


Qy 


1861 


TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCrAGAA^rrTrTTrrAPTrTrT 1 Q9H 

M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 | | II 1 1 1 

T G GC CT CTT AT TAT T G GAGT CAT G GC C C AGCAGCAGT C C C AGAAGCCT CT T C CACT GT CT 1920 


Db 


1861 


Qy 


1921 


ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGA(TrTGGGr^TrTrTArr ixa^acTrrr iQ«n 

I I M I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I | | | || | | | | M II I I I I I I I I I | | 

ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 


Db 


1921 


Qy 


1981 


CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGArrAPrA 

1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

CAAC T GAGAAT GG C T T T T CAT AC C CT GT GAT CT C CT ACT GGGT GGACAGC C AGGAC CAGA 2040 


Db 


1981 


Qy 


2041 


CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCrrnTTGA 91 DD 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I I M | | | | 
CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 


Db 


2041 


Qy 


2101 


CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGrrrrArTTTGTPA ?i 60 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 


Db 


2101 


Qy 


2161 


CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 
1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 


Db 


2161 


Qy 


2221 


CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 80 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 22 8 0 


Db 


2221 



Qy 22 81 AGAAGGC C C C GT T AAG CAGAGAGCAAC AC CT C C AGT CT C CCAAGGAAT GC AG GAC CT CT G 234 0 

I I I I I I I I I I I I I I I I I ! I I I I I i I I I I I I I I I I I I I I 1 | | | M I I 1 I I I I I I I I I I I I I 
Db 22 81 AGAAGGC CCC GT TAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAAT GCAGGAC CT CT G 234 0 

Qy 2341 C CAGT GAT GT GGAC GCT GACAACAAC T GC C T AGGC AC T GAGGTAGC T TAAACT CT AG GC A 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 24 00 

Qy 24 01 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I | I | | | | | | 
Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 24 60 

Qy 24 61 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2 52 0 

I I I I I II II II I I I I I II I I II I I I I I I I I I I II I I I I I I | | I I I | | | | | | | | | | | | | | | 
Db 2461 T GACT AGGAT GAC AGC AG C ACAAAAGAC CACC T TTCTCCCCT GAGAGGAGC TT CT GCT AC 2520 

Qy 2521 T CT GC AT C ACT GAT GACAC T C AG C AGGGT G AT GCACAGCAGT CT GC CT CC C CT AT GG GAC 2580 

I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I I I I I I I I II I I I I I I I I I I 
Db 2521 T CT GCAT CACTGAT GACACTCAGC AGGGT GAT GCACAGCAGT CT GCCT CCCCTAT GGGAC 258 0 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2 641 T ACACTGATATT GAAGAACCT GGAGAGGAT CCTTCAGTT CTGGCCATT CCAGGGACC CT C 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2641 T ACACT GAT ATT GAAGAAC CT GGAGAG GAT C CT T C AGT T CT GGC CAT T C CAGGGAC C CT C 2 700 

Qy 2701 C AGAAAC ACAGT GT TT CAAGAGACCCT AAAAAACCT GC C T GT C C CAG GAC C CT AT GGT AA 2760 

I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 27 01 CAGAAACACAGT GT T T CAAGAGAC C CT AAAAAAC CT G CCT GT CC C AGGAC C CT AT GGT AA 27 60 

Qy 2761 T GAAC AC CAAACAT CTAAACAAT C AT AT GCTAACATGC CACT CCT GGAAACT C CACT CT G 2820 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2761 T GAAC AC CAAACAT CTAAACAAT CAT AT GCTAACAT G C CACT CCT GGAAACT C CACT CT G 2 820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 288 0 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I I I I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3 000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 3 061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 T AAAAATAT AAGGCT TAAAAAAA 3143 



Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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; PRIOR APPLICATION NUMBER: 60/103678 

; PRIOR FILING DATE: 1998-10-08 

; PRIOR APPLICATION NUMBER: 60/103679 

; PRIOR FILING DATE: 1998-10-08 

; PRIOR APPLICATION NUMBER: 60/103711 

; PRIOR FILING DATE: 1998-10-08 

; PRIOR APPLICATION NUMBER: 60/104257 

; PRIOR FILING DATE: 1998-10-14 

; PRIOR APPLICATION NUMBER: 60/104987 

; PRIOR FILING DATE: 1998-10-20 

; PRIOR APPLICATION NUMBER: 60/105000 

; PRIOR FILING DATE: 1998-10-20 

; PRIOR APPLICATION NUMBER: 60/105002 

; PRIOR FILING DATE: 1998-10-20 

; PRIOR APPLICATION NUMBER: 60/105104 

; PRIOR FILING DATE: 1998-10-21 

; PRIOR APPLICATION NUMBER: 60/105169 

; PRIOR FILING DATE: 1998-10-22 
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; PRIOR FILING DATE: 1998-10-22 
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; PRIOR FILING DATE: 1998-10-26 

; PRIOR APPLICATION NUMBER: 60/105694 

; PRIOR FILING DATE: 1998-10-26 

; PRIOR APPLICATION NUMBER: 60/1058 07 

; PRIOR FILING DATE: 1998-10-27 

; PRIOR APPLICATION NUMBER: 60/105881 

; PRIOR FILING DATE: 1998-10-27 

; PRIOR APPLICATION NUMBER: 60/105882 

; PRIOR FILING DATE: 1998-10-27 

; PRIOR APPLICATION NUMBER: 60/106023 

; PRIOR FILING DATE: 1998-10-28 

Query Match 100.0%; Score 3143; DB 15; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
QY 1 GG GCT GAGG CACT GAGAGACC GGAAAGC CT GGCAT T C CAGAGG GAG GGAAAC GC AGC GG C 60 

I M I I I t I I I I II I II I! I I I I I I I I I I I I I | I I I I I | | | | | | | | | | | | || | | || M I I I 

Db 1 GGGCTGAGGCACT GAGAGACC GGAAAGC CT GGCAT T C CAGAGGGAG GGAAAC GCAGC GGC 60 

QY 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 12 0 

M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | M | | | | 
Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I M I I II I I I I I I I I I I I I I I I | | | | | | || I I I I I II I I I I I I I I I I I I I | | I I I I 
Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I | I | I I | | | | | | | | | | | | | | | | | | | | | | | 

Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 



Qy 



241 CAGGGGAT GAAC GTAGGGCACT TAGCTT CT T C CAC CAGAAG GG C C T CCAGGAT T T T GACA 300 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I M I I I I I II I I I I t | | | M | | | | | | | | | | 

Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

QY 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

. M I I I I I I I I I I I I I I I I I I I I | I I | | | | | | I I I I I I I I I I I I I I | | | | M | | | | | | | | | 
Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

QY 361 CCT TGGATAT C CAGGAT CCAGGGGT CCCCAGGCTAAAGAACAT GATAC CGT GGCCAGCCA 420 

I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I | | | | | | | | | 
Db 361 CC TT GGAT AT C CAGGAT CCAGGG GT C C C C AG GCT AAAGAAC AT GATAC CGT GGC CAGC C A 42 0 

Qy 421 GT GAC AGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT GAGAC AC AGT GT T T C A 4 80 

I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GT GAC AGAAAAAAGAGT GAAT GT GC C T T T AAGAAGAAGAG C AAT GAGAC AC AGT GT T T C A 480 

Qy 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I M I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I || | | | | || | | || | | | | M | | | | | | 

Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AG G AC AAG G T CAT G GAG G GAAAAG G C C AAAG C C C C T T T GAC C C C G C T C AC AAG CAT AC G G 660 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CT GT CTTGGT GGAT GGGAT GCT CTAT T CT GGTACTAT GAACAACTT CCT GGGCAGT GAGC 72 0 

Qy 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 7 80 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 721 C CAT CCT GAT GC GCAC ACT GGGAT C C C AGC CT GT C CT CAAGAC C GACAACT T C CT C CGCT 780 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
Db 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 

Qy 841 T CT T C GAGGAGAC AGC CAGC GAGT T T GACT T CT T T GAGAGGC T C C AC ACAT C GC GGGT GG 900 

I I 1 I I I I I II I I I I I I I I I II I I I I I I II I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 T C T T C GAG GAG AC AG C C AG C GAGT T T GAC T T C T T T GAG AG G C T C C AC A CAT CGCGGGTGG 900 

Qy 901 CTAGAGT CT GCAAGAAT GAC GT GGGC GGCGAAAAGCT GCT GCAGAAGAAGT GGACCAC CT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 901 C T AGAGT CT GCAAGAAT GAC GT GG GC G G C GAAAAG CT GC T GCAGAAGAAGT G GAC C AC CT 960 

Qy 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

I I I M I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | | | || | | | | | 
Db 961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 102 0 

Qy 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I M M I I I I I I I I I I I I I I I II I II I I I I I | | | | | | | | | | | | | | | | | || | | | | | | | | | 

Db 1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 108 0 



Qy 



1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | I I I I I I 



Db 1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

Qy 1141 TT GAAC GTGTCTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACTA 1200 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I | | | I | I I I I I I 

Db 1141 TT GAAC GT GT C T T TAAGGGGAAAT ACAAAGAGT T GAAC AAAGAAACT T C AC G CT GGAC T A 12 00 

QY 1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | M | 
Db 12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

Qy 1261 ATAAGGCC CT GAC CT T CAT GAAGGACCAT TT C CT GAT G GAT GAGCAAGT G GT GG GGAC G C 1320 

I I M I I I I I I I M M II I I I II I I I I I I I II I I I I I I I I I | | | | | || | M | | | | | | | | | | 
Db 1261 ATAAG GC C C T GAC CT T CAT GAAGGACCAT TT C CT GAT GGAT GAG CAAGT G GT GG GGAC GC 1320 

Qy 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I M I I I I I I I I I I I I I II I I I I I || I || | | | | | | | | | | | | | | | || | | || | | | | | | | | || | 
Db 1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

Qy 1381 TT GAT GGGCACAGC CATCTT GT CAT GT ACCTGGGAAC CACCACAGGGT CGCT C CACAAGG 1440 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

Qy 1441 CT GT GGTAAGT GG G GACAGCAGT GCT C AT CT GGT G GAAGAGATT C AGCT GTT C C CT GAC C 1500 

I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I II I I I I 

Db 1441 CT GT GGTAAGT GG GGACAGC AGT GCT C AT CT GGT G GAAGAGAT T C AG CT GT T CC CT GAC C 1500 

Qy 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I | | | || | | | | | 
Db 1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

Qy 1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CAGGAGGT GT CT GGAGGGT GCCCCGAGC CAACT GT AGT GT CTAT GAGAGCT GT GT GGACT 1620 

Qy 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I | | | | || | | | 

Db 1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

Qy 1681 T GT CT G C C C C CAAC CT GAAC T C CT GGAAG CAGGAC AT GGAG C GGGGGAAC C C AGAGT GGG 1740 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

Qy 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I M I I I I I M I I I I I I I I I I I I I II I I I I | | | || | | | | | | | | | | | | | || | | | | | | | | | 
Db 1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

Qy 18 01 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

Qy 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

Qy 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I I I I I I I I M M I II I I I II I I I I I I I I I I I I I I I I I || I I I I | | | | | | | | | | | | | | | | | 

Db 1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 



Qy 1981 C AAC T GAGAAT GG CTT TT CAT AC CCT GT GAT CT C CT AC T GGGT G GAC AGCC AGGAC CAGA 204 0 

M I I I M II II I II II I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 204 0 

Qy 2 041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | 
Db 2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 

Qy 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

I I I I I I I I I M II I I I M I I I I t I II I I I I I I I I I I I I I I | | | | | | || | | | M | | | | | | | 

Db 2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

Qy 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I | | | | | I I I I II I I I I I I I 
Db 2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

Qy 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I M I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I M I I I I 

Db 2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

Qy 2281 AGAAGGC C C CGT TAAGCAGAGAGCAACACCT C CAGT CT C C CAAGGAAT GCAGGAC CT CT G 2340 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | | | | | | | | | | | | | M I I I 
Db 2281 AGAAGGC CC C GT TAAGC AGAGAG CAACACC T C CAGT CT CC CAAG GAAT GCAGGAC CT CT G 234 0 

Qy 2341 CCAGT GAT GTG GACGCT GACAACAAC T G CCT AGGCACT GAGGT AGCT TAAACT C T AGGCA 2400 

M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 24 00 

Qy 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2 460 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

Qy 2461 T GACT AGGAT GACAGCAGC ACAAAAGAC CAC CTTT CT C C C CT GAGAGGAG CT TCT GCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2461 TGACTAGGATGACAGCAGCACAAAAGACCAC CTTT CT CCCCT GAGAGGAGCT T CT GCTAC 2520 

Qy 2521 TCT GCAT CACT GAT GACACT C AG C AG GGT GAT GCAC AGCAGT CT G CCT C C CCT AT G GGAC 2580 

I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M | | I | I | I | | | | | 
Db 2521 TCTGCATCACTGATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCT7VACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2 64 0 

I I M I I I I M I I I I I I I I I I II I I I I I I I I I I I I | | | | | | | | | | | | | | || | | | | | | | | | | 
Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

Qy 2 641 TACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTC 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2641 T ACACT GAT AT T GAAGAAC CT GGAGAGGAT C CT T C AGT T C T GGCCAT T CC AGGGAC C CT C 2700 

Qy 2701 CAGAAACAC AGT GT T T CAAGAGAC C C TAAAAAAC CT GC CT GTC CC AGGAC CCT AT GGT AA 2760 

I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 
Db 2701 C AGAAACACAGT GT T T CAAGAGAC CCT AAAAAAC CT GC CT GT C C CAGGAC C CT AT GGTAA 2760 

Qy 2761 T G AAC AC C AAAC AT C T AAAC AAT CAT AT G C T AAC AT G C CAC T C C T G G AAAC T C CAC T C T G 2820 

I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I | | | | I | | | | | I I I I I I I I I I 
Db 2761 T GAACAC CAAACAT CTAAACAAT CAT AT GCTAACAT GCCACT C CT GGAAACT CCACT CT G 2820 



Qy 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

1 I i I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | M I I I I I I t I I 1 I I I I 
Db 2 821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 28 80 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I I I I I I I I I I I M I I I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I | | | I I I I 
Db 2 881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2 941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

I I I I I i i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I | | | | 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

I I I I I I I M M I I I I I I I I II I I I I I I I I I I I I I I I I I I I || I | | | | | | | | | | | | | | | | | 

Db 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 

Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 
Db 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

Qy 3121 TAAAAATATAAGGCT TAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCT TAAAAAAA 3143 
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Query Match 100.0%; Score 3143; DB 15; Length 3143; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 3143; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

QY 1 G G G C T GAGGCAC T GAGAG AC C GGAAAG C CT GGC AT T C C AGAGG GAG GGAAAC G C AG C G GC 60 

I M I II I I I I I I I I I I I I I I I I I I II I I I I I I I ! I I I I I I I I I | | | I | | | | | | | | | | | | | 
Db 1 G GGC T GAGGCAC T GAGAGAC C GGAAAG C CT GGCAT T C C AGAG GGAG GGAAAC G C AGC G GC 60 

QY 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I M | I I I I 

Db 61 ATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCC 120 

Qy 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 180 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I i I I I 

Db 121 TGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGC 18 0 

Qy 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 24 0 

I I M I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || || | M | | | 
Db 181 TGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATG 240 

Qy 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I | | | | | | | 
Db 241 CAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACA 300 

Qy 301 CTCTGCTCCT GAGT GGT GAT G GAAAT ACT C T CT AC GTGGGGGCTC GAGAAG C CAT T CT GG 3 60 

M I I I I I I I I I I I I I I I I I I I I I I | | | I | I | | | | | M I I I II I II I I I I I II II I I I I I I 

Db 301 CTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGG 360 

Qy 3 61 CCTT GGATAT CCAGGATC CAGGGGT CCCCAGGCTAAAGAACAT GAT AC C GT GGCCAGC CA 420 

I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 361 C CTT GGATAT CC AG GAT C CAGGGGT C C C CAGGCTAAAGAAC AT GAT AC C GT GGC C AGC CA 42 0 

Qy 421 GT GACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAATGAGACACAGT GTTT CA 480 

M I I I I I I I I I I M I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GT GACAGAAAAAAGAGT GAAT GT GC C T T TAAGAAGAAGAGCAAT GAGACAC AGT GT T T C A 480 

Qy 4 81 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 481 ACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCG 54 0 

Qy 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

M I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 541 CCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGG 600 

Qy 601 AG GACAAGGT CAT GGAGGGAAAAG GC CAAAGCC CCTT T GAC C C C G CT C ACAAGC AT AC GG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 

Db 601 AGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGG 660 

Qy 661 CT GTCTTGGT GGAT GGGATGCT CTATT CT GGTACTAT GAACAACTTC CT GGGCAGT GAGC 72 0 

I I I I I I II I I I I I I I I I I I M I I I I I I I I I I MINIMI 

Db 661 CTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGC 720 

Qy 721 C CAT C CT GAT GC GC ACACT GGGAT C C CAGC C T GT C CT CAAGAC CGACAACT T CCTCCGCT 780 

II 1 M 1 M M M I I I M M I I I I I I II M II II I M I II I I I I I II II I 

Db 721 CCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCT 7 80 

Qy 781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 840 



781 GGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT 84 0 

841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 
N i I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | , , 

841 TCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGG 900 

901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 
I ' I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

901 CTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCT 960 

961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 
M I I I I I I I I I I I | | | | || | IM | || | | | | | | | , | | | , | | | | , | | 

961 TCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCC 1020 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | 

1021 ACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCT 1080 

1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 114 0 

I I I I I I I N I I I I I I i I I I I I I I I I I I I I I | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I 
1081 CCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACA 1140 

1141 TTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTA 1200 

I I I I I I I I MM I I I I I I I I I I I I I I I I I I I i i i i i i i i i i i i i i 

1141 TTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTA 1200 

12 01 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 12 60 

I I I I I N I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I | I | | 
1201 CTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTG 1260 

1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

1261 ATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGC 1320 

1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | 
1321 CCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCC 1380 

1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
1381 TTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGG 1440 

1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

I I I I I I II I I II I I I I I I I I II I I I I I II I I I II I I I I I I I I I I I I I 

1441 CTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACC 1500 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

MINIM I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 CTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCT 1560 

1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1561 CAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACT 1620 

1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 
M M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



1621 GTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCC 1680 

1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I 

1681 TGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGG 1740 

1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | , | 

1741 CATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTA 1800 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1801 AAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCT 1860 

1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

I I I M I I I I I I I I I I I I I I I I | | | | | | | | | | | | I I I I I I I I I I I IN 

1861 TGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCT 1920 

1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 1980 

I N I I I I I I I I I I I I I I i I I I I I I I I I I | | | | | | | | | | | | | | I II I I I I ! I I I I I I I I I I 
1921 ACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGG 198 0 

1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 2040 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGA 2040 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 2100 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 CCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGA 210 0 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

HI I I II I I I I I I I I I I I I I I I I I I I I I I I I I Ml 

2101 CCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCA 2160 

2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

I I I I I I I I I I M I I I I I I II I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
2161 CTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCC 2220 

2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

I I N I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
2221 CATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGG 2280 

2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 2 340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

2281 AGAAGGCCCCGTTAAGCAGAGAGCAACACCTCCAGTCTCCCAAGGAATGCAGGACCTCTG 2340 

2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 

HI Mill || | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

2341 CCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCA 2400 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I I I I II 

2401 CAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2520 

I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I I I 

2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTAC 2520 



Qy 2521 TCTGCATCACTGATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGAC 2580 

1 > I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | ,, | ,,, , 

Db 2521 TCTGCATCACTGATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGAC 2580 

Qy 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

1 I I I I M I I I I I I I I | | | | | | ! | | | | | | | | M M I I I I I I I I I I | | | | | | | | | | | | | | | | 

Db 2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

Qy 2641 TACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTC 2700 

1 1 I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I II I 

TACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGTTCTGGCCATTCCAGGGACCCTC 2700 



Db 2641 



Qy 2701 CAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGTCCCAGGACCCTATGGTAA 2760 

I I I I N I I I I I I I I I I M I I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I I I I I I 

Db 2701 CAGAAACACAGTGTTTCAAGAGACCCTAAAAAACCTGCCTGTCCCAGGACCCTATGGTAA 2760 

Qy 2761 TGAACACCAAACATCTAAACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTG 2820 

_ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | 
Db 2761 TGAACACCAAACATCTAAACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTG 2820 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

I " I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | , | ,, | 

Db 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCC 2880 

Qy 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 294 0 

I I M I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | I I I | | | | | | | | | | | 

Db 2881 TCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGA 2940 

Qy 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 

oo I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | M I I I I I I 
Db 2941 CCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG 3000 



Qy 3001 CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 3060 
I I I I I I I I I I I I I II | | | | | | | | | | | | | | | | | | | | || | | | || | | | | | , | | | , | | | 

CAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCC 



Db 3001 



3060 



Qy 3061 TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 3120 

' I I I I I I I I N I I I N I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I 

TCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTAT 312 0 



Db 3061 



Qy 3121 TAAAAATATAAGGCTTAAAAAAA 3143 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TAAAAATATAAGGCTTAAAAAAA 3143 
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